<?xml version="1.0" encoding="utf-8"?><?xml-stylesheet title="XSL formatting" type="text/xsl" href="http://mirmodynamics.com/feed/rss2/xslt" ?><rss version="2.0"
  xmlns:dc="http://purl.org/dc/elements/1.1/"
  xmlns:wfw="http://wellformedweb.org/CommentAPI/"
  xmlns:content="http://purl.org/rss/1.0/modules/content/"
  xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
  <title>Mirmo Dynamics - Tag - charset</title>
  <link>http://mirmodynamics.com/</link>
  <atom:link href="http://mirmodynamics.com/feed/tag/charset/rss2" rel="self" type="application/rss+xml"/>
  <description>Si tu kiffes pas reunoi, t'écoutes pas et puis c'est tout.</description>
  <language>en</language>
  <pubDate>Sun, 14 Mar 2010 19:59:01 +0100</pubDate>
  <copyright>2003-2009 &amp;copy; Geoffrey Bachelet</copyright>
  <docs>http://blogs.law.harvard.edu/tech/rss</docs>
  <generator>Dotclear</generator>
  
    
  <item>
    <title>Charset detection with python</title>
    <link>http://mirmodynamics.com/post/2008/12/17/Charset-detection-with-python</link>
    <guid isPermaLink="false">urn:md5:e9f7e6241350bbcc5987a9894e6ba490</guid>
    <pubDate>Wed, 17 Dec 2008 12:30:00 +0100</pubDate>
    <dc:creator>Geoffrey</dc:creator>
        <category>Geekeries</category>
        <category>chardet</category><category>charset</category><category>detection</category><category>encoding</category><category>python</category>    
    <description>    &lt;p&gt;I was looking for a way to easily determine a file's charset when I stumbled upon the &lt;a href=&quot;http://chardet.feedparser.org/&quot;&gt;Universal Encoding Detector&lt;/a&gt;. Just wanted to share it.&lt;/p&gt;


&lt;h3&gt;Installation:&lt;/h3&gt;
&lt;pre&gt;
$ wget http://chardet.feedparser.org/download/chardet-1.0.1.tgz -O - | tar xz
$ cd chardet-1.0.1
$ python ./setup.py build
$ sudo python ./setup.py install
&lt;/pre&gt;


&lt;h3&gt;Usage:&lt;/h3&gt;

&lt;p&gt;From a python console:&lt;/p&gt;
&lt;pre&gt;
&amp;gt;&amp;gt;&amp;gt; import chardet
&amp;gt;&amp;gt;&amp;gt; chardet.detect(open('/path/to/your/file', 'r').read())
{'confidence': 0.98999999999999999, 'encoding': 'utf-8'}
&lt;/pre&gt;


&lt;p&gt;Nice !&lt;/p&gt;</description>
    
    
    
          <comments>http://mirmodynamics.com/post/2008/12/17/Charset-detection-with-python#comment-form</comments>
      <wfw:comment>http://mirmodynamics.com/post/2008/12/17/Charset-detection-with-python#comment-form</wfw:comment>
      <wfw:commentRss>http://mirmodynamics.com/feed/atom/comments/1161</wfw:commentRss>
      </item>
    
  <item>
    <title>MySQL, Interclassement et Recherche</title>
    <link>http://mirmodynamics.com/post/2006/11/14/MySQL-Interclassement-et-Recherche</link>
    <guid isPermaLink="false">urn:md5:d5ef97391a00890550e71a668793f45e</guid>
    <pubDate>Tue, 14 Nov 2006 13:16:00 +0100</pubDate>
    <dc:creator>Geoffrey</dc:creator>
        <category>Le saviez vous ?</category>
        <category>charset</category><category>sql</category>    
    <description>    &lt;p&gt;Sur une colonne en interclassement &lt;code&gt;utf8_bin&lt;/code&gt;, une recherche de type &lt;code&gt;LIKE&lt;/code&gt; sera &lt;em&gt;case sensitive&lt;/em&gt; (sensible à la casse) par défaut (je n'ai pas cherché / trouvé de moyen d'inverser ce comportement). Alors que sur un interclassement &lt;code&gt;utf8_unicode_ci&lt;/code&gt;, la recherche se fait en mode &lt;em&gt;case insensitive&lt;/em&gt; (insensible à la casse), à moins d'employer la syntaxe &lt;code&gt;LIKE BIN 'needle'&lt;/code&gt;.&lt;/p&gt;</description>
    
    
    
          <comments>http://mirmodynamics.com/post/2006/11/14/MySQL-Interclassement-et-Recherche#comment-form</comments>
      <wfw:comment>http://mirmodynamics.com/post/2006/11/14/MySQL-Interclassement-et-Recherche#comment-form</wfw:comment>
      <wfw:commentRss>http://mirmodynamics.com/feed/atom/comments/718</wfw:commentRss>
      </item>
    
  <item>
    <title>Gestion des charset sous vim</title>
    <link>http://mirmodynamics.com/post/2006/07/12/Gestion-des-charset-sous-vim</link>
    <guid isPermaLink="false">urn:md5:4a16301f71dddbe109cb0a89f530a4ed</guid>
    <pubDate>Wed, 12 Jul 2006 12:50:00 +0200</pubDate>
    <dc:creator>Geoffrey</dc:creator>
        <category>Geekeries</category>
        <category>charset</category><category>vim</category>    
    <description>    &lt;p&gt;Ne vous attendez pas a trouver un guide exhaustif de la gestion des encodages de caractères sous &lt;acronym&gt;VIM&lt;/acronym&gt; dans ce billet, d'autres sites et surtout la doc fait ça beaucoup mieux que moi. Je m'en vais juste vous présenter le minimum vital pour vous dépatouiller dans ce foutoire que sont les charset. Le saint graal est consistué de deux variables de configuration: &lt;code&gt;encoding&lt;/code&gt; et &lt;code&gt;fileencoding&lt;/code&gt;.  Les plus perspicaces auront déjà compris les quelques explications qui suivent.&lt;/p&gt;


&lt;p&gt;&lt;code&gt;encoding&lt;/code&gt; est la variable qui détermine l'encodage des caractères &lt;strong&gt;en cours d'édition&lt;/strong&gt;, tandis que &lt;code&gt;fileencoding&lt;/code&gt; contient l'encodage qui sera utilisé à la sauvegarde du fichier.&lt;/p&gt;


&lt;p&gt;Concrétement, si vous tapez:&lt;/p&gt;


&lt;pre&gt;:set encoding=utf-8
:set fileencoding=iso-8859-15&lt;/pre&gt;


&lt;p&gt;Vous pouvez copier/coller du texte en UTF-8, et quand vous sauvegarderez votre fichier (&lt;code&gt;:w&lt;/code&gt; par exemple), vos données seront automatiquement convertie et sauvegardée en ISO-8859-15.&lt;/p&gt;</description>
    
    
    
          <comments>http://mirmodynamics.com/post/2006/07/12/Gestion-des-charset-sous-vim#comment-form</comments>
      <wfw:comment>http://mirmodynamics.com/post/2006/07/12/Gestion-des-charset-sous-vim#comment-form</wfw:comment>
      <wfw:commentRss>http://mirmodynamics.com/feed/atom/comments/561</wfw:commentRss>
      </item>
    
</channel>
</rss>