« Lingrとフォト蔵のAPIを使ってチャットと画像でもにゃもにゃ | メイン | 自己学習で分類精度を向上させるベイジアンフィルタ »

絵文字の相互変換リスト
このエントリーをブックマークに追加 このエントリーをlivedoorクリップに追加

こんばんは。harukです。

2週間前からビデオポップ担当になり、まず最初に、3キャリアの絵文字の変換から取り組みました。

検索して探してみたものの、いいものが見つからなかったのですが、幸いにも、3キャリアそれぞれメールでは絵文字の自動変換があるので、それを利用して作ることができます。(昔は手入力で一つ一つやってました)

Tab区切りのテキストファイル(TSV)を置いておきましたので使いたい方は使ってください。

絵文字の番号の付け方はそれぞれ以下のようになっています。

  • DoCoMo(i-mode)
    基本絵文字:%i(1~176)%
    拡張絵文字:%i(1001~1076)%
  • au(EZweb)
    絵文字番号=%e(1~822)%
  • SoftBank
    PAGE1(G):%s( 1~ 90)%
    PAGE1(E):%s(101~190)%
    PAGE1(F):%s(201~290)%
    PAGE1(O):%s(301~377)%
    PAGE1(P):%s(401~476)%
    PAGE1(Q):%s(501~562)%

ファイルは各キャリアごとになっています。

  • i-mode → EZweb, SoftBank
    [ファイルの内容]
    i-mode番号, Shift_JIS(hex), EZweb, SoftBank, EZweb(webでの自動変換)

    i-mode→EZwebはメールだけではなく、webでの自動変換もあります。 近似の絵文字を表示してくれます。
    メールとwebでの変換を見比べてみると、36文字も違っていました。
  • EZweb → i-mode, SoftBank
    [ファイルの内容]
    EZweb番号, Shift_JIS(web/hex), i-mode, SoftBank

    文字になってしまうものが多いので、気に入らない人は変えたほうがいいです。
  • SoftBank → i-mode, EZweb
    [ファイルの内容]
    SoftBank番号, Webコードの一部, i-mode, EZweb

    SoftBankからの場合は〓(ゲタ)になるものが多いです。
このデータが少しでもお役に立つのであれば幸いです。

トラックバック

このエントリーのトラックバックURL:
http://www.unoh.net/mt32/mt-tb.cgi/764

コメント

大変参考になりました。
どうもありがとうございます。

一点気になったのですが、何故TSV形式でデータを保存されているのでしょうか?

YAMLとかの方が後々扱いやすくないでしょうか?

> まっちゃん様
作っていた時に、Excel等の表計算ソフトにコピペして確認しやすいかったためです。
扱いやすい形式へ変換して使っていただければと思います。

コメントを投稿


画像の中に見える文字を入力してください。