public marks

PUBLIC MARKS with tag utf-8

2015

Choisir le bon interclassement MySQL pour UTF-8 | WIIP

by dzc
pour le Français, on peut utiliser utf8_bin sur une colonne où tout le texte est soit en minuscules, soit en majuscules de façon à obtenir les meilleures performances. Si on n'est pas sur de la casse des caractères, il faut utiliser utf8_general_ci. Enfin, si vous travaillez avec plusieurs langues différentes, utf8_unicode_ci sera alors peut-être plus adapté.

2013

2012

PHP et UTF-8

by astrochoupe
Un article très complet sur la problématique de l'encodage des caractères en PHP et avec les systèmes adjacents : MySQL, filesystem, HTTP...

2011

2010

UTF-8 Setup Mini HOWTO

by sylvainulg (via)
evaluating (require 'un-define) (set-coding-priority-list '(utf-8)) (set-coding-category-system 'utf-8 'utf-8) in the scratch buffer before opening the UTF-8 document was sufficient. RAW documents remained RAW, afaik.

Detecting UTF BOM - byte order mark

by dzc (via)
simplified example (php) on how to detect and remove the three bytes (UTF BOM)

Internationalisation Gotchas — Internationalisation Tips

by Spone
The amount of work required to internationalise a website is woefully underestimated, and sometimes, the codebase is compromised to the extent that many features or capabilities are impossible to deliver with the existing code. In many cases, complete ground-up rewrites are needed to separate cleanly the business logic from the localisation requirements of countries. Mostly this requires developers and engineers of platforms to be aware of the internationalisation implications of their implementation choices. What may seem like an engineering best practice could very well be a massive barrier for localising sites to various countries.

Official Google Blog: Unicode nearing 50% of the web

by srcmax (via)

About 18 months ago, we published a graph showing that Unicode on the web had just exceeded all other encodings of text on the web. The growth since then has been even more dramatic.

2009

Unicode code converter [ishida >> utilities]

by ycc2106
Type or paste text in any of the green or grey shaded boxes and click on the button Convert button above it. Alternative representations will appear in all the other boxes. You can then cut

Comment convertir une DB de latin1 à UTF8 | MySQL

by dzc & 1 other (via)
J’ai utilisé cette technique pour convertir une base de données de 115Go et tout c’est bien déroulé. L’astuce consiste à transformer les chaines de caractères à un format binaire, pour ensuite les reconvertir en UTF8. Il faut cependant ne pas négliger un aspect lors de cette conversion. Les caractères Latin1 utilise 1 byte par caractère alors qu’un caractère UTF8 utilisent 3 bytes par caractère. Si l’espace disque est une de vos contraintes, il ne faut pas prendre cette conversion à la légère!

Entretien d'Embauche

by kemar
Marrant le blog BD "Entretien d'embauche" de Nathaniel Ferguson http://bit.ly/MflZg [from http://twitter.com/kemar/statuses/1647123552]

Changer de jeu de caractères pour UTF-8 - Openweb.eu.org

by srcmax & 2 others (via)
Préparer l’internationalisation d’un site n’est pas une opération triviale, car dans la plupart des cas, elle nécessite de passer d’un jeu de caractères à un autre. Or, un site Web résulte d’un assemblage de plusieurs logiciels, où les questions de jeux de caractères apparaissent à chaque niveau. Cet article résume les différents points de la configuration d’un site « classique » dans le cadre de l’utilisation d’UTF-8.

2008

utf-8 Growth On The Web - W3C Q&A Weblog

by julie & 2 others

On Google's blog, Mark Davis is explaining that Google is moving to Unicode 5.1. The article unfortunately mixes unicode and utf-8 as it has been noticed by David Goodger in Unicode misinformation. But the really interesting bit is the growth of utf-8 on the Web. These data should be interesting for the development of http, html 5 and validators.

PUBLIC TAGS related to tag utf-8

ascii +   big5 +   blog +   caractères +   character +   charset +   chinese +   codage caractères +   conversion +   dev +   developpement +   encodage +   encodage des caractères +   encoding +   entity +   font +   forum +   ftp +   google +   groupe:clever-age +   gtk+ +   howto +   html +   i18n +   iconv +   javascript +   l10n +   lang:en +   language +   library +   linux +   localization +   mysql +   opensource +   php +   phpmyadmin +   plone +   samba +   sql +   ubuntu +   unicode +   utf8 +   vim +   web +   wordpress +   xhtml +   xml +   亂碼 +   字型 +   编码 +  

Active users

mfaure
last mark : 25/11/2015 15:23

dzc
last mark : 20/11/2015 09:13

astrochoupe
last mark : 17/04/2012 08:01

simo
last mark : 11/11/2011 22:49

julie
last mark : 05/11/2011 13:22

eledo34
last mark : 15/06/2011 09:16

clochix
last mark : 27/02/2011 10:42

sylvainulg
last mark : 27/10/2010 09:28

ghis
last mark : 10/09/2010 07:58

Spone
last mark : 06/04/2010 10:11

srcmax
last mark : 29/01/2010 10:57

ycc2106
last mark : 30/10/2009 14:37

RETFU
last mark : 16/06/2009 08:07

kemar
last mark : 29/04/2009 19:37

Nissone
last mark : 18/02/2009 12:41

piouPiouM
last mark : 07/02/2009 18:22

jmfontaine
last mark : 04/07/2008 17:37