12. Unicode、絵文字、Androidのテキスト関連のハンドリング、無数の文字トリビア (のな)

12. Unicode、絵文字、Androidのテキスト関連のハンドリング、無数の文字トリビア

ゲスト: のな (@ttuusskk)

Androidのテキスト処理を担当しているのなさんと、UnicodeやUnicode絵文字、テキスト処理の複雑さ、文字トリビアなどについて話をしました。

速度 x1.0 (遅く / 速く) -15秒 / -5秒 / +5秒 / +15秒
この時点にリンク

TCFMはサポーターの投げ銭によって収益を上げています。このコンテンツに課金してもいいよという方はぜひクリエイター支援サイトPatreonから登録してご協力ください。

0:00	イントロ
1:28	自分の読めない言語のテキスト処理は大変
3:07	MMDDYYYYとDDMMYYYYの違いによる国際化バグ
5:23	Left-to-right言語とright-to-left言語
6:15	アラビア語と英語のハイフネーション
7:19	日本語の禁則処理
9:12	Android Oで絵文字の表示が最大3倍速くなった
12:23	結合絵文字の規格が決まっていない状態で実装を書くのは大変
14:49	国旗の絵文字の仕組みと仕様バグ
18:18	ハンバーガー絵文字では肉の上にチーズが乗っているべきか
20:30	絵文字はガラケー起源
23:42	モヤイ像の絵文字はあるけどモアイ像の絵文字はない
24:52	ガラケーに存在したけどUnicodeに収録されなかった稀な絵文字
27:28	新元号の合成文字
30:49	ひらがなやカタカナはもっと若いコードポイントに割り当ててくれればよかった
33:40	UTF-8は新世界のASCII
38:47	英語はフォントの機能を比較的ふんだんに使う言語
40:40	汎用的な数式プロセッサをフォントだけで作ることができるかも？
42:42	Unicode規格書の紙バージョン
43:41	JISの幽霊文字
47:01	将棋の相手の駒の記号（上下逆の漢字）をUnicodeに追加したい
50:32	100万文字は十分か
52:12	Unicodeの文字名称の規格バグ
53:47	Swiftは文字がgrapheme単位
55:21	Goだとコードポイント単位
57:50	ミャンマーのZawgyiフォントがUnicodeの既存の文字を勝手に使っている
1:00:36	東アジアのコンピュータ用文字セットの歴史的経緯
1:03:00	ハイフネーションは多種多様
1:05:38	最近の多言語処理はコンピュータの金字塔の一つ
1:09:21	Android Oでは明朝体が標準で入るかもしれない
1:15:20	サブピクセルレンダリング

追記

JIS委員会が何の手がかりも得られなかった文字は「妛」ではなく「彁」です。