12. Unicode、絵文字、Androidのテキスト関連のハンドリング、無数の文字トリビア
ゲスト: のな (@ttuusskk)
Androidのテキスト処理を担当しているのなさんと、UnicodeやUnicode絵文字、テキスト処理の複雑さ、文字トリビアなどについて話をしました。
速度 x1.0
(遅く /
速く)
-15秒 /
-5秒 /
+5秒 /
+15秒
この時点にリンク
この時点にリンク
TCFMはサポーターの投げ銭によって収益を上げています。 このコンテンツに課金してもいいよという方はぜひクリエイター支援サイトPatreonから登録してご協力ください。
0:00 | イントロ |
1:28 | 自分の読めない言語のテキスト処理は大変 |
3:07 | MMDDYYYYとDDMMYYYYの違いによる国際化バグ |
5:23 | Left-to-right言語とright-to-left言語 |
6:15 | アラビア語と英語のハイフネーション |
7:19 | 日本語の禁則処理 |
9:12 | Android Oで絵文字の表示が最大3倍速くなった |
12:23 | 結合絵文字の規格が決まっていない状態で実装を書くのは大変 |
14:49 | 国旗の絵文字の仕組みと仕様バグ |
18:18 | ハンバーガー絵文字では肉の上にチーズが乗っているべきか |
20:30 | 絵文字はガラケー起源 |
23:42 | モヤイ像の絵文字はあるけどモアイ像の絵文字はない |
24:52 | ガラケーに存在したけどUnicodeに収録されなかった稀な絵文字 |
27:28 | 新元号の合成文字 |
30:49 | ひらがなやカタカナはもっと若いコードポイントに割り当ててくれればよかった |
33:40 | UTF-8は新世界のASCII |
38:47 | 英語はフォントの機能を比較的ふんだんに使う言語 |
40:40 | 汎用的な数式プロセッサをフォントだけで作ることができるかも? |
42:42 | Unicode規格書の紙バージョン |
43:41 | JISの幽霊文字 |
47:01 | 将棋の相手の駒の記号(上下逆の漢字)をUnicodeに追加したい |
50:32 | 100万文字は十分か |
52:12 | Unicodeの文字名称の規格バグ |
53:47 | Swiftは文字がgrapheme単位 |
55:21 | Goだとコードポイント単位 |
57:50 | ミャンマーのZawgyiフォントがUnicodeの既存の文字を勝手に使っている |
1:00:36 | 東アジアのコンピュータ用文字セットの歴史的経緯 |
1:03:00 | ハイフネーションは多種多様 |
1:05:38 | 最近の多言語処理はコンピュータの金字塔の一つ |
1:09:21 | Android Oでは明朝体が標準で入るかもしれない |
1:15:20 | サブピクセルレンダリング |
- のなさんによる絵文字の解説
- Unicode
- UTF-8
- ハンバーガー絵文字とチーズの位置問題
- リガチャー(合字)
- ß (エスツェット)
- 幽霊文字
- ビャンビャン麺
- Ponanzaのために作られた将棋の相手の駒の外事
- チェスの駒のUnicode記号
- ドミノタイルのUnicode記号
- Unicodeの麻雀牌
- Brakcet
- モヤイ像(「イースター島のモアイ像に似た日本の石像の絵文字」として定義されている)
- Rob PikeによるUTF-8の歴史
- Zawgyi font
- O'ReillyのCJKV本(フグ本)
- キリル文字
- モンゴル文字
- 満洲文字
- Notoフォント
- 明朝体
- アンチエイリアシング
- サブピクセルレンダリング
- ペンタイル
追記
- JIS委員会が何の手がかりも得られなかった文字は「妛」ではなく「彁」です。