Turing Complete FMはRui Ueyamaによるプログラミングについてのポッドキャストです。
12. Unicode、絵文字、Androidのテキスト関連のハンドリング、無数の文字トリビア
ゲスト: のな (@ttuusskk)
Androidのテキスト処理を担当しているのなさんと、UnicodeやUnicode絵文字、テキスト処理の複雑さ、文字トリビアなどについて話をしました。

速度 x1.0 (遅く / 速く) -15秒 / -5秒 / +5秒 / +15秒
この時点にリンク
0:00イントロ
1:28自分の読めない言語のテキスト処理は大変
3:07MMDDYYYYとDDMMYYYYの違いによる国際化バグ
5:23Left-to-right言語とright-to-left言語
6:15アラビア語と英語のハイフネーション
7:19日本語の禁則処理
9:12Android Oで絵文字の表示が最大3倍速くなった
12:23結合絵文字の規格が決まっていない状態で実装を書くのは大変
14:49国旗の絵文字の仕組みと仕様バグ
18:18ハンバーガー絵文字では肉の上にチーズが乗っているべきか
20:30絵文字はガラケー起源
23:42モヤイ像の絵文字はあるけどモアイ像の絵文字はない
24:52ガラケーに存在したけどUnicodeに収録されなかった稀な絵文字
27:28新元号の合成文字
30:49ひらがなやカタカナはもっと若いコードポイントに割り当ててくれればよかった
33:40UTF-8は新世界のASCII
38:47英語はフォントの機能を比較的ふんだんに使う言語
40:40汎用的な数式プロセッサをフォントだけで作ることができるかも?
42:42Unicode規格書の紙バージョン
43:41JISの幽霊文字
47:01将棋の相手の駒の記号(上下逆の漢字)をUnicodeに追加したい
50:32100万文字は十分か
52:12Unicodeの文字名称の規格バグ
53:47Swiftは文字がgrapheme単位
55:21Goだとコードポイント単位
57:50ミャンマーのZawgyiフォントがUnicodeの既存の文字を勝手に使っている
1:00:36東アジアのコンピュータ用文字セットの歴史的経緯
1:03:00ハイフネーションは多種多様
1:05:38最近の多言語処理はコンピュータの金字塔の一つ
1:09:21Android Oでは明朝体が標準で入るかもしれない
1:15:20サブピクセルレンダリング

追記