12. Unicode、絵文字、Androidのテキスト関連のハンドリング、無数の文字トリビア
ゲスト: のな (@ttuusskk)
Androidのテキスト処理を担当しているのなさんと、UnicodeやUnicode絵文字、テキスト処理の複雑さ、文字トリビアなどについて話をしました。
速度 x1.0
(遅く /
速く)
-15秒 /
-5秒 /
+5秒 /
+15秒
この時点にリンク
この時点にリンク
TCFMはサポーターの投げ銭によって収益を上げています。 このコンテンツに課金してもいいよという方はぜひクリエイター支援サイトPatreonから登録してご協力ください。
| 0:00 | イントロ |
| 1:28 | 自分の読めない言語のテキスト処理は大変 |
| 3:07 | MMDDYYYYとDDMMYYYYの違いによる国際化バグ |
| 5:23 | Left-to-right言語とright-to-left言語 |
| 6:15 | アラビア語と英語のハイフネーション |
| 7:19 | 日本語の禁則処理 |
| 9:12 | Android Oで絵文字の表示が最大3倍速くなった |
| 12:23 | 結合絵文字の規格が決まっていない状態で実装を書くのは大変 |
| 14:49 | 国旗の絵文字の仕組みと仕様バグ |
| 18:18 | ハンバーガー絵文字では肉の上にチーズが乗っているべきか |
| 20:30 | 絵文字はガラケー起源 |
| 23:42 | モヤイ像の絵文字はあるけどモアイ像の絵文字はない |
| 24:52 | ガラケーに存在したけどUnicodeに収録されなかった稀な絵文字 |
| 27:28 | 新元号の合成文字 |
| 30:49 | ひらがなやカタカナはもっと若いコードポイントに割り当ててくれればよかった |
| 33:40 | UTF-8は新世界のASCII |
| 38:47 | 英語はフォントの機能を比較的ふんだんに使う言語 |
| 40:40 | 汎用的な数式プロセッサをフォントだけで作ることができるかも? |
| 42:42 | Unicode規格書の紙バージョン |
| 43:41 | JISの幽霊文字 |
| 47:01 | 将棋の相手の駒の記号(上下逆の漢字)をUnicodeに追加したい |
| 50:32 | 100万文字は十分か |
| 52:12 | Unicodeの文字名称の規格バグ |
| 53:47 | Swiftは文字がgrapheme単位 |
| 55:21 | Goだとコードポイント単位 |
| 57:50 | ミャンマーのZawgyiフォントがUnicodeの既存の文字を勝手に使っている |
| 1:00:36 | 東アジアのコンピュータ用文字セットの歴史的経緯 |
| 1:03:00 | ハイフネーションは多種多様 |
| 1:05:38 | 最近の多言語処理はコンピュータの金字塔の一つ |
| 1:09:21 | Android Oでは明朝体が標準で入るかもしれない |
| 1:15:20 | サブピクセルレンダリング |
- のなさんによる絵文字の解説
- Unicode
- UTF-8
- ハンバーガー絵文字とチーズの位置問題
- リガチャー(合字)
- ß (エスツェット)
- 幽霊文字
- ビャンビャン麺
- Ponanzaのために作られた将棋の相手の駒の外事
- チェスの駒のUnicode記号
- ドミノタイルのUnicode記号
- Unicodeの麻雀牌
- Brakcet
- モヤイ像(「イースター島のモアイ像に似た日本の石像の絵文字」として定義されている)
- Rob PikeによるUTF-8の歴史
- Zawgyi font
- O'ReillyのCJKV本(フグ本)
- キリル文字
- モンゴル文字
- 満洲文字
- Notoフォント
- 明朝体
- アンチエイリアシング
- サブピクセルレンダリング
- ペンタイル
追記
- JIS委員会が何の手がかりも得られなかった文字は「妛」ではなく「彁」です。