« Lingrとフォト蔵のAPIを使ってチャットと画像でもにゃもにゃ | メイン | 自己学習で分類精度を向上させるベイジアンフィルタ »

絵文字の相互変換リスト
このエントリーをはてなブックマークに追加 このエントリーをlivedoorクリップに追加

こんばんは。harukです。

2週間前からビデオポップ担当になり、まず最初に、3キャリアの絵文字の変換から取り組みました。

検索して探してみたものの、いいものが見つからなかったのですが、幸いにも、3キャリアそれぞれメールでは絵文字の自動変換があるので、それを利用して作ることができます。(昔は手入力で一つ一つやってました)

Tab区切りのテキストファイル(TSV)を置いておきましたので使いたい方は使ってください。

絵文字の番号の付け方はそれぞれ以下のようになっています。

  • DoCoMo(i-mode)
    基本絵文字:%i(1~176)%
    拡張絵文字:%i(1001~1076)%
  • au(EZweb)
    絵文字番号=%e(1~822)%
  • SoftBank
    PAGE1(G):%s( 1~ 90)%
    PAGE1(E):%s(101~190)%
    PAGE1(F):%s(201~290)%
    PAGE1(O):%s(301~377)%
    PAGE1(P):%s(401~476)%
    PAGE1(Q):%s(501~562)%

ファイルは各キャリアごとになっています。

  • i-mode → EZweb, SoftBank
    [ファイルの内容]
    i-mode番号, Shift_JIS(hex), EZweb, SoftBank, EZweb(webでの自動変換)

    i-mode→EZwebはメールだけではなく、webでの自動変換もあります。 近似の絵文字を表示してくれます。
    メールとwebでの変換を見比べてみると、36文字も違っていました。
  • EZweb → i-mode, SoftBank
    [ファイルの内容]
    EZweb番号, Shift_JIS(web/hex), i-mode, SoftBank

    文字になってしまうものが多いので、気に入らない人は変えたほうがいいです。
  • SoftBank → i-mode, EZweb
    [ファイルの内容]
    SoftBank番号, Webコードの一部, i-mode, EZweb

    SoftBankからの場合は〓(ゲタ)になるものが多いです。
このデータが少しでもお役に立つのであれば幸いです。

トラックバック

このエントリーのトラックバックURL:
http://www.unoh.net/mt32/mt-tb.cgi/764

この一覧は、次のエントリーを参照しています: 絵文字の相互変換リスト:

» PHP携帯絵文字表示ライブラリ(PHP埋込型・au絵文字名対応版)を公開しました from 我流天性 - がらくた屋
前々から自分用にカスタマイズしながら使っていた、携帯絵文字を簡単に表示できるPHPのライブラリをcodecheck.inにコミットしました。 ▼Firef... [詳しくはこちら]

コメント

大変参考になりました。
どうもありがとうございます。

一点気になったのですが、何故TSV形式でデータを保存されているのでしょうか?

YAMLとかの方が後々扱いやすくないでしょうか?

> まっちゃん様
作っていた時に、Excel等の表計算ソフトにコピペして確認しやすいかったためです。
扱いやすい形式へ変換して使っていただければと思います。

だいぶ前ですが、絵文字管理ライブラリ作成時、参考にさせていただきました。http://gard.no-ip.info/emo/

便利な情報ありがとうございます。

自信がないのですが、emoji_i2es.txtに
2つ違うかなぁという所がありました。

・タブがない
・e330 -> s330

F9BC と F9C7 の行です。

コメントを投稿


画像の中に見える文字を入力してください。