Hiroshi Kurokawa’s site

浮動小数点数の文字列化アルゴリズムSchubfach

2023-08-12T07:00:00+00:00

TL;DR

C++20のstd::formatやJavaのDouble#toString()のもとにもなっている¹浮動小数点数の文字列化アルゴリズムSchubfachアルゴリズムの論文を読んだ。

この記事ではそのアルゴリズムを解説するが厳密な定義やエッジケースは論文をあたってほしい。

問題とその背景

浮動小数点数の文字列化がなぜ問題になるかというと、IEEE 754の浮動小数点数を10進数の小数点数に変換したときに人間にとって読みやすい表記が自明ではないからである。これは10進数の有限桁の小数点数が有限桁の2進数で表せる保証がないことが一因となっている。

よくある例を考えよう。10進数の1.2を2進数表記するとつぎのような循環小数になる²。

\[1.00110011001100110011001100110011001100110011001100110...\]

これをIEEE 754の倍精度浮動小数点数で表そうとすると、仮数部が52ビットなので、小数点以下53ビット以下は切り捨てる（より正確には最近接偶数丸め）。したがって、人間が端末にむかって1.2と入力すると、多くの場合はそれが上記のビット列として表され仮数部52ビットの倍精度浮動小数点数として記憶領域に格納される。さて、これを再び同じ人間に10進数で表示するときにどうすればいいだろうか。

困るのは、倍精度浮動小数点数に変換したときに、この格納されている値になり得る10進数の小数点数が 1.2 を含めて複数あるということである。実際、この倍精度浮動小数点数をそのまま10進数に戻すと以下のようになる。

\[1.1999999999999999555910790149937383830547332763671875\]

これをそのまま表示するのも一案ではあるが、入力した人間からすると1.2が上記のような数値で表示されると、これは長すぎて困惑することだろう。一方コンピュータからすると、この値も1.2もあるいは1.20000000000000001も倍精度浮動小数点数にしてしまえばすべて内部的には同じ表現になってしまい、どれを表示するのが適切か不明である。

ということで、任意の浮動小数点数を人間に読みやすい10進数文字列として表示するときにどのようにフォーマットするのが適切か、というのが問題となる³。

ナイーブな解法とその欠陥

とてもナイーブな解法は小数点以下何桁かで打ち切って表示するというものである。上の例でいえばたとえば小数点以下5桁で四捨五入すれば、1.2になる。表示するときにアプリケーションで小数点以下何桁まで表示したいかを選び、あとは四捨五入するなり切り捨てるなりして表示するというのが1つの解法ではあるし、実際いくつかのアプリケーションではそれを行っている。

ただし、この解法には重大な欠陥がある。というのは、そうやって表示した10進数をふたたびIEEE 754の倍精度浮動小数点数に変換したときに同じバイナリ表記になる保証がない、ということである。たとえば、1.2000000000000001は小数点以下5桁で四捨五入すると1.2になってしまうが、この値を2進数表記すると 1.0011...00110100 となり、これは 1.2 を倍精度浮動小数点数にしたものと異なる値である。

このように、浮動小数点数→文字列→浮動小数点数と変換したときに、同じ値になっていてほしいという要求をround tripと呼ぶらしい⁴。ちなみに、このround tripを保証するために小数点以下何桁まで表示すべきか、という問題はすでに1968年に解かれていて、小数点以下17桁まで表示すればround tripは保証される⁵。

ただし、ほとんどの人間はround tripが保証されている中でもっとも桁数が小さいものを読みやすいと感じるだろう。たとえば1.20000000000000001も1.2も同じ倍精度浮動小数点数になるなら1.2を読みやすいと感じるはずだ⁶。

問題の定式化

以上を踏まえて、浮動小数点数の文字列化の問題をつぎのように定式化する。

有限な任意の浮動小数点数表記（以降\(fp\)とする）で\(v\)と表される正の数が与えられたとき（負の場合は同じことをやればいいので簡単のために正とする）に\(D\)進数で表記された\(d_v\)をつぎのように定義する。

\(round\)関数を実数から\(fp\)へ変換する関数とする
\(R = \{ x \mid round(x) = v \}\)、つまり上記の変換によって\(v\)になる値の集合とする
\(m = \min\{len(x) \mid x \in R \}\)は集合\(R\)の各値を\(D\)進表記したときの長さ（後述）の最小値
\(T = \{x \in R \mid len(x) = m\}\)、つまり集合\(R\)のうち\(D\)進表記した長さが\(m\)の値の集合
\(d_v\)を集合\(T\)のうちもっとも\(v\)に近いものと定義する、ただし、そのような\(v\)が2つあった場合は\(d_v\)は偶数のものとする

なお\(fp\)はIEEE 754の単精度浮動小数点数表記や倍精度浮動小数点数表記と考えてもらって構わない。また\(D\)も一般には\(10\)であるが、ここではより一般化した形式を考える。

また、\(len\)関数で表される長さであるが、これはざっくり言えば\(D\)進数で表された値の先頭に連続する0と末尾に連続する0を取り除いた桁数ということになる。たとえば\(12000\)の長さは\(2\)だし、\(0.450\)の長さも\(2\)、\(1.23\)の長さは\(3\)となる。科学表記にしたときの仮数部の長さといってもよい。論文ではより厳密に定義しているが、アルゴリズムを理解するにはこれくらいで十分だと思う。

問題の定式化（修正版）

これはどれくらい一般的なのか知らないが、論文の著者によれば、すくなくともJavaのDouble#toString()メソッドの仕様では小さな値に1.0E-21のような科学表記がつかわれる。これがなにを意味するかというと、長さは最低でも\(2\)なわけであるから、前節の定式化において\(m=1\)の場合は、\(m=2\)となる値も候補に入れてもっとも\(v\)に近い値を選ぶべき、というのである。

たとえば\(v = 20 \cdot 2^{-1074} = 9.88\ldots\cdot10^{-323}\)であるが、前節の定式化にしたがうと集合\(T\)は

\[\begin{align} R &= \{1\cdot10^{-322}, 97\cdot10^{-324}, 98\cdot10^{-324}, 99\cdot10^{-324}, \ldots\} \\ m &= 1 \\ T &= \{1\cdot10^{-322}\} \end{align}\]

となり、\(d_v = 1\cdot10^{-322}\)となる。これは科学表記だと1.0E-322となり有効数字2桁も使っていてもったいない、というわけだ。この場合は9.9E-323の方がより真実の値に近いので相応しいと著者は主張している。

個人的には細かすぎる気もするのだけれど、ともあれ、この新たな要求を言葉にすると、\(M\)を正の整数としたときに\(d_v\)はその長さが\(M\)を超えない限りにおいて\(v\)に近いものを選ぶ、となる。前節の定式化は\(M=1\)としたもので、JavaのDouble#toString()のような挙動にしたければ\(M=2\)とすればよいことになる。

修正版の問題の定式化はつぎのようになる。

有限な\(fp\)で\(v\)と表される正の数、および\(M\ge1\)が与えられたときに\(D\)進数で表される\(d_v\)をつぎのように定義する。

\(round\)関数を実数から\(fp\)へ変換する関数とする
\(R = \{ x \mid round(x) = v \}\)、つまり上記の変換によって\(v\)になる値の集合とする
\(m = \min\{len(x) \mid x \in R \}\)は集合\(R\)の各値を\(D\)進表記したときの長さの最小値
もし\(m \ge M\)なら、\(T = \{x \in R \mid len(x) = m\}\)すなわち集合\(R\)のうち長さが\(m\)の値の集合とする。そうでない場合は\(T = \{x \in R \mid len(x) \le M\}\)とする
\(d_v\)を集合\(T\)のうちもっとも\(v\)に近いものと定義する、ただし、そのような\(v\)が2つあった場合は\(d_v\)は最終桁の値が偶数のものとする

アルゴリズムの概要

次節以降ではアルゴリズムの詳細を見ていくが、先に大まかなアイディアを説明する。これは原論文には書いていない、自分の解釈なので間違っている可能性があることに留意されたい。

前節の定式化で分かると思うが、まずround tripを保証するには浮動小数点\(v\)が表す区間に収まる範囲で\(d_v\)を選ぶ必要がある。さらにそのなかで一番長さが短いものを知りたい。さて、ここで数直線上に\(10^i, 2\cdot 10^i, 3\cdot 10^i, \ldots\)とまず目盛りをつけ、つぎに\(10^{i-1},2\cdot 10^{i-1},\ldots\)というように、粗いものから徐々に細かくして\(i\)を減らしながら\(10^i\)間隔（\(i\)は整数）の目盛りをつけていく作業を考えよう。この目盛りが細かくなるほど基本的に長さが長くなる（科学表記したときの仮数部の長さが長くなる）。

このときに\(v\)が表す実数区間には最初は目盛りが1つも打たれないが、\(i\)を減らすにしたがって、どこかで目盛りが初めて入るはずである。そしてこの初めて区間に入った目盛りの値が目指す\(d_v\)になる。もちろん初めて入る目盛が複数ということもあり得るがその場合は\(v\)に近い方を手順に従って選べばよい。

さらに、区間に入る目盛りが見つかったらそれ以上は\(i\)を小さくしなくてもいいことに注意してほしい。というのは、図からもわかるように、目盛りを細かくしたときに必ずそれより前の粗い目盛りと重なる（\(0.1\)の目盛りはそのすべてが\(0.01\)の目盛りと重なるし、とうぜん\(1\)の目盛りもすべてがそれらと重なる。\(j \lt i\)について\(10^i\)の目盛りは\(10^j\)の目盛りと重なる）ことと、目盛りが細かいほど値が長くなることから、\(10^i\)の目盛りが\(v\)が代表する区間と重なったらそれが求める\(d_v\)になる。この図でいえば、\(2\cdot 10^i\)がその区間に入っているので\(M=1\)なら文句なしにこれが\(d_v\)になる。一方\(M=2\)なら\(19\cdot 10^{i-1}\)とどちらが\(v\)に近いか調べることになる。

また、この初めて区間に打たれる目盛りはたとえば二分法で探索してもよいが、ちょっとした計算で求まる。というのは\(v\)が表す区間の幅を\(\alpha\)とすれば、\(i = \lceil\log_{10}\alpha\rceil\)のあたりを調べればよいからだ。つまり目盛り幅がちょうど\(\alpha\)になる付近を探せばかならず区間に入る目盛りが見つかるし、その目盛りの数がぎりぎり0になるかならないかになる。

したがって、\(i = \lceil\log_{10}\alpha\rceil\)を計算して、あとは目盛りが区間に入るか調べ、入らなかったら\(i\)を\(1\)小さくしてもう一度調べれば、\(d_v\)が見つかる。

以上がこのSchubfachアルゴリズムの概略である。以降ではより詳細にただし原論文ほどは厳密にせずに解説する。

前準備

さて、アルゴリズムの詳細について説明するまえにアルゴリズムが前提とする事実を確認する。

\(v\)が代表する区間\(R_v\)

浮動小数点数（\(fp\)）で表せる値は離散値であり、その値の代表する実数の区間がある。具体的に\(fp\)で表した値\(v = c \cdot 2^q\) とする。ただし \(c\)は正の整数で\(1\ldots\)の形式であるとする⁷、\(q\)は整数。このとき\(v\)が表す区間の左端を\(v_l\)、右端を\(v_r\)とする。

ここで\(v_l\)は、\(v\)とその1つ前の\(fp\)で表せる値のちょうど中間点になる。これは数式で表すと\(v_l=c_l2^q\)とすれば

\[c_l = \begin{cases} c - 1/4 & \text{もし}v\text{が正規化数の最小値より大きなちょうど2の累乗なら} \\ c - 1/2 & \text{それ以外} \\ \end{cases}\]

となる。この条件分けが発生するのは浮動小数点数を大きくしていったときにちょうど\(q\)が増えるタイミングで左側と右側で分布が異なるからである。

いっぽう \(v_r = c_r2^q\)としたときに\(c_r = c + 1/2\)となる。

以降ではこの\(v\)が代表する区間を\(R_v\)と表す。

集合\(D_i\)

任意の整数\(i\)について\(D_i\)を\(D_i = \{dD^i\}\)で表される集合とする。ただし\(d\)は任意の自然数。

このとき与えられた\(v\)について、

\[s_i(v) = \lfloor vD^{-i}\rfloor \\ t_i(v) = s_i(v) + 1\]

として、

\[u_i(v) = s_i(v)D^i \\ w_i(v) = t_i(v)D^i\]

とすると、この\(u_i\)と\(w_i\)が集合\(D_i\)の中で\(v\)に最も近い可能性がある2つの値である。

証明については原論文の\(\S\)6を当っていただきたいが、ざっくり説明すると、\(s_i\)は\(v\)を\(D\)進表記して、小数点を\(i\)だけ左に動かし（\(i \lt 0\)なら右）、小数点以下を切り捨てた値であり、\(u_i\)はその\(s_i\)の\(D\)進表記したものの小数点を\(i\)だけ右（\(i \lt 0\)なら左）に動かした値になる。\(w_i\)は\(D_i\)の中で\(u_i\)より1つ大きいものとなる。

具体例を挙げて説明すると、\(v = 123.4\)、\(D = 10\)、\(i = 1\)とすると、\(s_1 = 12\)、\(t_1 = 13\)、\(u_1 = 120\)、\(w_1 = 130\)となる。\(D_1\)の集合は10の倍数で\(120\)と\(130\)以外の値が\(123.4\)により近いことはない、ということが分かるだろう。

さて、この集合\(D_i\)がなんの役に立つかというと、長さに関わってくる。というのは、直感的に\(D_i\)と\(D_{i-1}\)を比較すると後者の方がより細かい刻みを表しているので、前者の方が長さが短くなることが予想される。もうすこし正確に言えば、ある値\(v\)の周辺で\(D_i\)と\(D_{i-1}\)の各要素を比較したら前者の長さが後者のものより長くなることはない。

これも原論文の\(\S\)6で厳密に定式化されているが、ここでは具体例を考えれば十分だろう。たとえば\(D=10\)としたときに\(v = 123.4\)に近い\(D_1\)の要素は\(120\)と\(130\)であった。これらは長さが\(2\)である。一方\(D_0\)で近い可能性がある2つの値は\(123\)と\(124\)で、こちらは長さが\(3\)となる。もちろん\(v = 120.3\)のようにキリがよければ\(D_0\)の\(v\)に近い要素も\(120\)と長さ\(2\)になるが、\(120\)は\(D_1\)の要素でもあるので\(D_1\)の要素より短くなることはない。

\(R_v\)と\(D_i\)の積

ここまで説明すると、この浮動小数点数の文字列化の問題はつぎのように言いかえられることが分かる。まずは\(M=1\)とする。

浮動小数点数\(v\)が与えられたときに、その\(v\)が代表する区間\(R_v\)と集合\(D_i = \{d D^i\}\)の積を\(R_i = R_v \cap D_i\)とする⁸。空集合でない\(R_i\)のうち、\(i\)がもっとも大きなものを求めたい。

\(i\)が最大の空でない\(R_i\)が求まれば、そのなかで\(v\)にもっとも近い値が\(d_v\)になる。\(M=2\)については、\(d_v\)の長さが\(1\)だったときに必要なら\(D_{i-1}\)も考慮に入れればよい。

例として仮数部が2ビットの浮動小数点数を考え\(v = 96.0, R_v = \left[ 88, 104 \right]\)を考えてみよう。\(i = 0, 1, 2, 3\)について\(R_i\)を調べてみるとつぎのようになる。

\[\begin{align} R_0 &= \{ 88, 89, \ldots, 104 \} \\ R_1 &= \{ 90, 100 \} \\ R_2 &= \{ 100 \} \\ R_3 &= \emptyset \\ \end{align}\]

この例では、\(R_2\)が空集合ではなくかついちばん短い要素を持つので、\(M=1\)の場合は\(d_v = 100\)となる。\(M=2\)の場合は\(R_0\)も調べ、このケースでは\(96\)が一番近いので\(96\)が選ばれる。

さて、この\(R_2\)のような集合を\(v\)に対して求めていきたいわけだが、じつは以下がなりたつ⁹。

\(k\)を\(D^k \ge \left\| R_v \right\| \gt D^{k+1}\)を満たす整数とすると、このような\(k\)は唯一でかつ\(R_k\)はすくなくとも1つの要素を持ち、\(R_{k+1}\)はせいぜい1つの要素を持つ。

したがって、通常は\(R_k\)と\(R_{k+1}\)を調べればよいし、\(M=2\)でかつ\(d_v\)の長さが\(1\)になりそうな場合はそれに加えて\(R_{k-1}\)を調べればよい。さらに、このような\(k\)は\(k = \lfloor \log_D \left\| R_v \right\| \rfloor\)と計算で求められる。

ここで、さきほどの\(v = 96\)の例で\(k\)を計算すると\(\lfloor \log_{10} 16 \rfloor = 1\)なので、\(M=1\)なら\(R_1\)と\(R_2\)だけ、\(M=2\)なら\(R_0\)も調べればよいことがわかる。

いくつかの変数の導入

次節からはアルゴリズムの詳細を見ていくが、簡単のために、この\(k\)をつかってあらかじめつぎの変数を導入しておく。

\[\begin{align} &K_{\min} = k\text{の取りうる最小値}\\ &K_{\max} = k\text{の取りうる最大値} \\ &k' = k + 1 \\ &s = s_k,\quad t = t_k,\quad u = u_k,\quad w = w_k \\ &s' = s_{k'}, \quad t' = t_{k'}, \quad u' = u_{k'}, \quad w' = w_{k'} \end{align}\]

この変数をつかうと、\(u\)と\(w\)の定義から、つぎのことがいえる。

\(u \in R_k\)もしくは\(w \in R_k\)のどちらかもしくは両方がなりたつ。また\(R_{k'} = \emptyset\)、\(R_{k'} = \{u'\}\)もしくは\(R_{k'} = \{w'\}\)のいずれかである。

アルゴリズムの詳細

\(s \ge D^M\)の場合
- これが何を意味するかというと、\(s\)と\(t\)どちらかの長さは\(M\)より大きくなる、ということである。たとえば\(M = 1, s = 10, t = 11\)もしくは\(M = 2, s = 999, t = 1000\)を考えれば分かるだろう。\(k-1\)を考えなければならないのは長さが\(M\)以下でより\(u\)や\(w\)よりも\(v\)に近い値が表せるときだが、このケースでは\(u_{k-1}\)も\(w_{k-1}\)も長さが\(M\)より大きくなるか、あるいは\(u, w\)のいずれかと一致してしまう¹⁰。したがって、\(k-1\)のケースは考える必要がない。
- \(R_{k'} \ne \emptyset\)の場合
  - \(R_{k'}=\{u'\}\)もしくは\(R_{k'}=\{w'\}\)となる
  - \(u', w'\)は\(u, w\)よりも長さが短いかもしくは\(u, w\)と一致するので、\(u', w'\)の2つのどちらか\(R_v\)に含まれる方が\(d_v\)になる
- \(R_{k'} = \emptyset\)の場合
  - 前節で述べたように\(u \in R_k\)もしくは\(w \in R_k\)が成り立つので、このどちらかが\(d_v\)になる
- まとめ： \(s \ge D^M\)のとき\(u' \in R_v\)もしくは\(w' \in R_v\)なら、それぞれ\(d_v = u'\)、\(d_v=w'\)となる。\(u', w' \notin R_v\)のときは\(d_v = u\)もしくは\(d_v = w\)となる。
\(D \le s \lt D^M\)の場合
- これは\(M=1\)のときは成立しないので\(M=2\)としてよい
- この場合は\(s, t\)の長さが\(1\)もしくは\(2\)になる。また両方の長さが\(1\)になることはない。\(s = 10, t = 11\)や\(s = 51, t = 52\)を考えれば分かるだろう。このケースも先ほどと同様に\(k-1\)を考える必要はない。なぜなら\(s_{k-1}\)も\(t_{k-1}\)も長さが\(3\)以上になるか、あるいは\(s\)や\(t\)と一致するからである。
- また、このとき、\(k + 1\)すなわち\(s', t'\)を考える必要もない。なぜなら\(u', w'\)が\(u, w\)より\(v\)に近いことはあり得ないし、長さが短くなったとしても\(1\)になるので、\(M=2\)の場合は\(v\)により近い\(u\)や\(w\)が選ばれるからである。
- まとめ： \(D \le s \lt D^M\)のとき\(d_v = u\)もしくは\(d_v = w\)
\(s \lt D\)の場合
- このとき\(u, w\)の長さは\(1\)になる。\(M=1\)ならこれが長さ\(M\)以下でもっとも\(v\)に近い値になる。
- \(M=2\)のときは\(u_{k-1}, w_{k-1}\)の長さが\(1\)もしくは\(2\)になり、より\(u, w\)よりも\(v\)から遠くはならないので\(d_v = u_{k-1}\)もしくは\(d_v = w_{k-1}\)
- まとめ： \(M=1\)なら\(d_v = u\)もしくは\(d_v = w\)、\(M=2\)なら\(d_v = u_{k-1}\)もしくは\(d_v = w_{k-1}\)

疑似コード

以上のアルゴリズムを疑似コードにするとつぎのようになる。ただし、\(s\)を計算するまえに\(s \lt D\)の条件分岐をしたいという要請から\(v = c 2^q\)と表したときに、\(s \lt D \Leftrightarrow c \lt C_{\text{tiny}}\)となる\(C_{\text{tiny}}\)をあらかじめ計算しておく¹¹。なお\(c\)と\(q\)はそれぞれ整数で浮動小数点数の仮数部のように\(c = 1\ldots\)という形式を満たしている。さらに\(v_\text{tiny} = C_\text{tiny}2^Q_\min\)とする。ここで\(Q_\min\)は\(fp\)で\(q\)が取り得る値の最小値。

また、\(s_{k-1} = s_k(vD)\)かつ\(u_{k-1}=u_k(vD)\)から、疑似コードでは\(v \lt v_\text{tiny}\)のときに\(v\)に\(vD\)を代入して計算してさいごに指数部を\(1\)減らす、という簡略化を行っている。

\[\begin{align} & \text{if} \, M = 2 \land v \lt v_\text{tiny} \, \text{then}\\ & \quad v \gets v D, \Delta k \gets -1 \\ & \text{else} \\ & \quad \Delta k \gets 0 \\ & \text{fi} \\ & c, q, k, s \text{を計算する} \\ & \text{if}\, s \ge D^M\,\text{then}\\ & \quad k' \gets k + 1, s' \gets s // D, u' \gets s' D^{k'}, w' \gets (s' + 1)D^{k'} \\ & \quad \text{if}\, u' \in R_v \, \text{then return}\, u' \\ & \quad \text{if}\, w' \in R_v \, \text{then return}\, w' \\ & \text{fi} \\ & u \gets sD^k, w \gets (s + 1) D^k \\ & \text{if}\, u \in R_v \land w \notin R_v\, \text{then} \\ & \quad \text{return}\, uD^{\Delta k}\, \\ & \text{fi} \\ & \text{if}\, u \notin R_v \land w \in R_v\, \text{then} \\ & \quad \text{return}\, wD^{\Delta k}\, \\ & \text{fi} \\ & \text{if}\, v - u \lt w - v\, \text{then} \\ & \quad \text{return}\, uD^{\Delta k}\, \\ & \text{fi}\\ & \text{if}\, v - u \gt w - v\, \text{then} \\ & \quad \text{return}\, wD^{\Delta k}\, \\ & \text{fi}\\ & \text{if}\, s \,\text{が偶数 then} \\ & \quad \text{return}\, uD^{\Delta k}\, \\ & \text{fi} \\ & \text{return}\, wD^{\Delta k} \\ \end{align}\]

なお、\(//\)は整数除算で余りを切り捨てる操作を表す。

このアルゴリズムをそのまま実装すると任意精度の計算（JavaのBigIntergerなど）を必要とするので、さらに改良してビット演算だけで行う方法が論文に紹介されている。また、このアルゴリズムはOpenJDKのDouble#toString()の実装のもとになっているのでコードを読んでもいいだろう。

蛇足

この論文に興味を持ったきっかけはPrinting double aka the most difficult problem in computer scienceという記事だった。記事の内容は率直に言って鼻持ちならない内容で他人のStackOverflowの回答を貶していく、という控え目にいってもこの作者と一緒に働きたくないな、というものだった。タイトルのdoubleの文字列化をコンピュータ科学で最も難しい問題と臆面もなく言い放つことにも反感を覚えて、論文を手にとった次第だ。

読んだ感想としては依然として「CSで一番難しい問題」とは思えないけれど、OpenJDKの実装にも使われるアルゴリズムを勉強できてよかった、と思う。

ただ、この浮動小数点数の文字列化という問題はかなり恣意的であるように思う。まず有効桁数を気にしない癖に出力がround tripを満たす範囲で短くあってほしい、という状況がよく分からない。実験や数値計算のアプリケーションでデータの再利用を前提とするなら有効桁数は常に気にするし、出力データで正確さを担保したければ記事の冒頭でも書いたように小数点以下17桁まで出力しておけばよい。一方、データの再利用を前提とせずにユーザーに表示するだけ、たとえばBMIの結果を表示する、となったらそれはそれでアプリケーションで適切に有効数字を決められるだろう。

この「いい感じに浮動小数点数を文字列化したい」という問題は、そう考えるとデバッグ用にログする場合くらいしか用途がなさそうで、実際JavaのDouble#toString()はまさにそういう用途だ。そう考えると、解こうとしている問題はかなり限定的で、わざわざがんばって高速化する意味がどれくらいあるかは分からない。

なお、このアルゴリズムの前にも浮動小数点数の文字列化にはいくつもアルゴリズムが提唱されているらしい。それらについては調べていないので、興味のある人はどうぞ調べてみてほしい¹²。

Stackoverflowの回答によると、C++20のstd::formatは{fmt}ライブラリをもとにしており、{fmt}ライブラリは浮動小数点数のフォーマットにDragonboxというライブラリをつかっており、このライブラリの元がこの論文らしい ↩
1.2がなぜ有限の2進数で表せないか考えるのは、ちょうどいい算数の問題だろう。一方で有限の2進数はかならず有限の10進数で表せることが分かっている。 ↩
ここではほとんどの人間は10進数の方が理解しやすいという前提をおいている。2進数の方が理解しやすいという人に対してはそのまま浮動小数点数のバイナリ表記を表示すればいいので簡単だ。 ↩
Schubfachの論文ではとくになんの説明もなしにround tripという用語が使われていた。初出はどこか分からないが往復のことをround tripと呼ぶし英語の表現としては自然なのかもしれない。 ↩
When is round-trip floating point radix conversion exact? https://www.johndcook.com/blog/2020/03/16/round-trip-radix-conversion/ ↩
率直にいうと、自分はたとえば数値計算で大量の数値を見るならすべての値の桁はそろっていてほしいし、これがどれくらい一般的な要求なのかやや疑問ではある。あと、17桁くらいならいいんじゃないと思ってしまうが、この感覚は一般的ではないのかもしれない。 ↩
分かりにくいが原論文がそうなっているので我慢されたい。たとえば\(v = 1.011_2\cdot 2^{-10}\)だったら\(c=101100000_2\)、\(q=-18\)となる ↩
なぜ\(R_v\)と同じ\(R\)を使うのが理解に苦しむが原論文がそうしているので混乱を避けるためにもそうする。読者は添字が\(v\)であるか、あるいは整数であるかで判断していただきたい。 ↩
詳細はまたも原論文に譲るが、アイディアとしては「鳩の巣原理」にもとづいており、このアルゴリズムをSchubfachと呼ぶのもこの原理の発明者ディリクレのドイツ名Schubfachprinzipに由来するらしい。 ↩
たとえば\(M=1\)で\(s_k(v)=10, t_k(v)=11\)となった場合を考えよう。\(s_{k-1}(v)\)と\(s_{k-1}(v)\)は\(v\)の値によるが、\(\{100, 101, 102, \ldots, 110\}\)のどれかであり、両端はそれぞれ\(s_k(v), t_k(v)\)と一致している。したがって\(k-1\)を探す必要はないことが分かる。 ↩
詳細はこれも原論文に譲るが、\(C_{\text{tiny}} = \lceil 2^{-Q_\min} D^{K_\min + 1} \rceil\)と表され、\(D=10\)で倍精度浮動小数点の場合は\(C_{\text{tiny}} = \lceil 2^{1074} 10^{-324 + 1} \rceil = 3\)、単精度浮動小数点の場合は\(C_{\text{tiny}} = 8\)となる。これは仮数部の下位2ビットもしくは3ビット以外がすべて0になっている場合なので、非正規化数のうちでもかなり小さい値であることがわかる。 ↩
日本語の資料だと浮動小数点数の文字列化（基数変換）という記事にいくつかの論文への参照が載っていた。 ↩

ChromeOS用SKK（chrome-skk）をWeb Storeに公開しました

2023-03-19T07:00:00+00:00

先日の記事でManifest V3の対応に時間がかかるのでWeb Storeの公開は先になりそうですと書いたのですが、多少進展があってギリギリ使い物になるかなくらいになったので公開しました。

https://chrome.google.com/webstore/detail/skk-japanese-input/gdfnmlnbnmgdliccidmiphhpicaecffj

詳細は https://github.com/hkurokawa/chrome-skk の README を読んでほしいのですが、最新版には以下のような既知の問題があります。

30秒以上同じウィンドウで何も入力していないと SKK 自体が動かなくなる（直接入力しかできなくなる）
タブやウィンドウを切り替えると直るが、直後にキーボードのキーを押下して文字が入力されるまで数秒のラグがある

これは回避策があって、Chrome のタブで Extension のオプションページを開き、開発者ツールを起動した状態で放置しておく、というものです。ハックなので、Chrome のバージョンが上がると動かなくなるかもしれませんが、とりあえず 112.0.5615.29 (Official Build) beta では動いています。

このハックが嫌な場合は https://github.com/hkurokawa/chrome-skk/releases から v0.x 系の zip をダウンロードして手動でインストールしてください。今後も v0.x 系は Manifest V3 に移行しないで、重要度の高いバグ修正は入れてメンテナンスしていこうと考えています。

要望や問題がありましたらお気軽に https://github.com/hkurokawa/chrome-skk/issues でご報告ください。

スプラトゥーン2でオールX（ただし北米）になった

2022-08-20T07:00:00+00:00

前の記事で、スプラトゥーン2にハマっていると書いたのだけれど、2年たってようやくウデマエがオールXになったので、メモ。

以下は2年間のパワーとウデマエの推移。

スプラトゥーン2のガチマッチでは参加している8人のプレイヤーの平均ガチマッチパワーというのが表示されるのだけれど、その平均パワーと、例としてガチエリアのウデマエを時系列グラフで表示している。ウデマエはC-が0として、以降Cが1、C+が2…、Sが9…、Xが20に対応する。

だいたい朝に1 - 2時間くらいガチマッチに潜るというのを習慣にしていた。プレイ時間は1300時間くらい。ヒーローモード、オクト・エキスパンション、サーモンランも含んでいるけれど、たぶんガチマに使った時間を考えると誤差だろう。

見ると分かるけれど、2020年の夏から始めて2021年の冬くらいにウデマエSでかなり停滞している。この頃はなかなかしんどくて、違うブキも試したり、画面を録画して反省したり知り合いに送って意見を貰ったりと試行錯誤していた。けっきょくブキはディアルスイーパーカスタムでかつ上にあるように疑似確でないギアで押し通した。たぶん強くないけれど低XP帯ならどのブキだろうがギアパワーだろうがそんなに関係ない気がしている。

2022年の年明けに急にウデマエが上がっているけれど、これはたぶん北米に引っ越したせいだと思っている。体感でしかないけれど、日本に比べると北米はガチマッチパワーの実態が数字よりも100 - 200くらい低い気がする。つまり北米での2,000が日本で1,800 - 1,900あたりになる。おそらくプレイ人口が少ないこと、あまりスプラトゥーン2に関する情報が出回っていないことが関係しているのだろう。実際に出張で2022年の6月に日本に帰ったときは、エリアはXになっていたけれど、あっという間にS+に降格してしまった。

そういう意味で、自分はオールXは達成したけれど、日本だったらS+5とかそのへんくらいの実力だと思っている。

振り返り

FPS/TPSと呼ばれるゲームは初めて、かつ、対人戦ゲームをじっくりやりこむのも初めてだったので、新鮮だった。最初はキルカメラで敵がイカ状態とヒト状態を高速で繰り返すのを見てコントローラが壊れたかバグかと思うくらいには初（うぶ）だった((いわゆる煽り行為))し、コントローラのジャイロの使い方もおぼつかなかったけれど、思い通りにキャラコンが出来るようになって、相手の場所をなんとなく把握できるようになると、俄然たのしくなった。

そこそこやり込むと分かるけれど、ともかくキャラコンとエイムでごり押しする対面能力だけで勝ち進むプレイヤーもいれば、盤面を把握してルールにうまく関与することで試合に勝とうとするプレイヤーもいる。他のFPSゲームは分からないけれどスプラトゥーン2は後者のプレイスタイルでも勝てるのがとてもよかった。

スプラトゥーン3がもうすぐ出る。どれくらいやり込むことになるかは分からないけれど、たのしみだ。

ChromeOS用SKKを公開しました

2022-08-06T07:00:00+00:00

chrome-skk v0.1.10を公開しました。インストール方法などはREADMEを参照ください。

もともとjmukさんがhttps://github.com/jmuk/chrome-skkとして公開していたレポジトリをフォークさせてもらいました。本当はChrome Web Storeに公開したかったのですが、Manifest V3に移行する必要があり、service worker化に関するバグが意外と時間がかかりそうだったので、先にzip形式で公開することにしました。

SKKはもう10年近く愛用しているIMEで、1年前に私用のノートパソコンをPixelbookにしたことがきっかけでChromeOS用のSKKの需要が自分の中で高まりました。幸い、上記のjmukさんのレポジトリを見つけたので、適当に変更して手元で快適に使っていたのですが、せっかくなので公開した次第です。

どれくらいChromeOSユーザーでSKK使いがいるか分かりませんが、よかったら使ってみてください。

近況報告

2022-02-18T07:00:00+00:00

米国に引っ越しました。

今週の月曜日に米国のベイエリアに引っ越しました。いまは会社の用意してくれたアパートに住みながら家を探したりしています。会社も仕事も前と同じです。近くにお住まいの方はぜひお声がけください。

浮動小数点数のパーサを書いてみた

2020-11-01T02:06:45+00:00

先日、こういうツイートを見かけた。で、さいきん浮動小数点数づいているのもあって自分も浮動小数点数の文字列表記をパースして単精度および倍精度浮動小数点数に変換するパーサを書いてみた。

非常に苦労したので書いた
もっといいやり方がありそうだし、もっとうまい説明ができるかもしれないけどこれが限界でした・・・

文字列少数点数表記を IEEE754 倍精度浮動小数点数にエンコードする方法｜Sukesan1984 #note https://t.co/2v5f1eMzea
— Sukesan1984 (@sukesan1984) October 22, 2020

この記事では、自分が実装したパーサを説明する。説明はいいからコードを見せろ、という人はこちらをどうぞ。

https://github.com/hkurokawa/FloatingPointNumberParser

ゴール

今回は浮動小数点数の理解を深めるために自分でパーサを書くのが目的である。したがって、パフォーマンスは気にしない。また、シンタックスエラーも気にしないことにした¹。さいわい先ほど引用したツイートへの補足ツイートにもあるがGo言語の標準ライブラリのテストケースがちょうどよさそうなので、このテストが通ることを目標とする。

https://golang.org/src/strconv/atof_test.go

実装方針

基本的にはWikipediaの記事にあるのと同じことをすればよい。

入力を10進数表記の文字列としよう（2進数表記でも同じ議論が成り立つ）。たとえば 0.15625 といった文字列だ。これを2進数表記にしたい。最初に気付くのは、無限精度のままこの10進数表記の値を扱う必要があるということだ²。一見、floatなら仮数部が23桁なので2進数表記で小数点以下23桁、切り上げや切り下げを考えても24桁まで見ればよさそうに思えるが、そうではない。最終的に最近接丸めをするには小数点以下24位が0だったとしても、そのさらに先で0以外の値があればそれは結果に影響する。したがって10進数表記の文字列を1文字目から順に見ていったとして、どこかでこれ以上読まなくてよいという場所は存在しない（ずっと0が続くのか、それともどこかで0以外が登場するのかは知る必要がある）。

以上のことから、まず10進数表記の文字列はそのまま無限精度の10進数の値として格納することにする。

つづいてこれを2進数表記に変換することを考えよう。整数部分については既知なので以降では小数部分についてだけ考える。

もっともナイーブな方法は変換したい値が\({0.5}\)より大きいか調べ、大きければ小数点以下第1位のビットを立てて\({0.5}\)を引く。つぎにその引いた結果と\({0.25}\)を比較し、それより大きければ小数点以下第2位のビットを立てる、という方法だ。この操作を行うと、たとえば10進表記の\({0.15625}\)という値は2進表記で\({0.00101}\)となることがわかる。

これは2進数の定義そのものなので理解はしやすいが、無限精度の10進数で引き算をやるのはあまりぞっとしない。ちょっと考えると、この\({0.5}\)を引いて、つぎは\({0.25}\)を引いて、という操作は、対象の値を\({2}\)倍して\({1}\)を引いて、さらに\({2}\)倍して\({1}\)を引くという操作と等価なことがわかる。じっさい、さきほどの\({0.15625}\)にこの操作を行うと同じ結果が得られる³。

さて、以上で無限精度の10進数を2進表記する方法がわかった。また、浮動小数点数の定義上、この値を\(a \times 2^{k}\)という形式にする必要がある。ただし\({a}\)は範囲\({[1, 2)}\)に収まる実数。すなわち、対象の数に\({2}\)もしくは\({\frac{1}{2}}\)を掛けて\({[1, 2)}\)の範囲に収める必要がある。このことから、無限精度の10進数が\({2}\)倍および\({\frac{1}{2}}\)倍の演算をサポートしている必要がある。

parseFloatのおおまかな実装

以下では、さきほど述べた\({2}\)倍および\({\frac{1}{2}}\)倍の演算をサポートした無限精度の10進数を表すクラス BigDecimal があるとする。これを使って値を浮動小数点数に変換する。

まずは\({[1, 2)}\)の範囲に収めよう。\({2}\)倍あるいは\({\frac{1}{2}}\)倍した場合はそれに合わせて指数部を増減させる。

    BigDeciaml d = new BigDecimal(s); // 10進数文字列表記を無限精度の10進数に保存する
    int exponent = 0;
    while (d.isEqualToOrGreaterThanTwo()) { // 2以上なら2未満になるまで1/2を掛ける
      d.divideByTwo();
      exponent++;
    }
    while (d.isLessThanOne()) { // 1未満なら1以上になるまで2を掛ける
      d.multiplyByTwo();
      exponent--;
    }
    exponent += 127; // バイアスを足す

さて、ここで d は\({[1, 2)}\)の範囲に入っているはずである。あとはこの小数部を2進数表記すればよい。なお d.discardNumberPart() は整数部分を0クリアするメソッドである。

    d.discardNumberPart();
    int mantissa = 0;
    for (int i = 22; i >= 0; i--) {
      d.multiplyByTwo();
      if (!d.isLessThanOne()) {
        mantissa |= 1 << i;
        d.discardNumberPart();
      }
    }

dを2倍して\({1.0}\)以上であればビットを立て、\({1}\)を引いている。

以上でほぼ終わりである。あとは符号部を組み合わせれば単精度浮動小数点数になる。

    int sign = d.isNegative() ? 1 : 0;
    int bits = mantissa | (exponent << 23) | (sign << 31);
    return Float.intBitsToFloat(bits);

いくつかのエッジケースの処理

ここまでで “1.0” や “3.1415” といった文字列はパースできるはずである。しかし、いくつかのエッジケースについて考慮が漏れている。

まずは “0.0” が与えられた場合。この場合はいくら2倍しても\({1}\)以上になることはないので無限ループになる。したがって “0” に等しい場合はearly returnする必要がある。

    if (d.isZero()) {
      return Float.intBitsToFloat(sign << 31);
    }

続いて、オーバーフローの場合。単精度浮動小数点数では\({2^{127}}\)を超える数を表すことはできない。したがって +Infinity もしくは -Infinity を返す必要がある。

    if (exponent > 127) return d.isNegative() ? Float.NEGATIVE_INFINITY : Float.POSITIVE_INFINITY;

非正規化数

非正規化数は対象の値が\({2^{-126}}\)より小さい場合に必要になる。まず2進数表記で\({0.xx\ldots x \times 2^{-126}}\)という形にして、そのうえで指数部は\({0}\)にクリアしておく。

    if (exponent >= -126) {
      // 正規化数
      // バイアスを足す
      exponent += 127;
    } else {
      // 非正規化数
      while (exponent < -126) {
        d.divideByTwo();
        exponent++;
      }
      exponent = 0;
    }

完成版

以上をすべて行った文字列をパースして単精度浮動小数点数を返すコードが以下である。今後バグが見つかった場合はGitHubレポジトリを更新していくので、最新版のコードが見たい方はそちらを参照いただきたい。

  public float parseFloat(String s) {
    BigNumber d = BigNumber.parse(s); // 10進数文字列表記を無限精度の10進数に保存する
    int sign = d.isNegative() ? 1 : 0;
    if (d.isZero()) {
      return Float.intBitsToFloat(sign << 31);
    }
    int mantissa = 0;
    int exponent = 0;
    while (d.isEqualToOrGreaterThanTwo()) { // 2以上なら2未満になるまで1/2を掛ける
      d.divideByTwo();
      exponent++;
    }
    while (d.isLessThanOne()) { // 1未満なら1以上になるまで2を掛ける
      d.multiplyByTwo();
      exponent--;
    }
    if (exponent > 127) return d.isNegative() ? Float.NEGATIVE_INFINITY : Float.POSITIVE_INFINITY;
    if (exponent >= -126) {
      // 正規化数
      // バイアスを足す
      exponent += 127;
    } else {
      // 非正規化数
      while (exponent < -126) {
        d.divideByTwo();
        exponent++;
      }
      exponent = 0;
    }
    d.discardNumberPart();
    for (int i = 22; i >= 0; i--) {
      d.multiplyByTwo();
      if (!d.isLessThanOne()) {
        mantissa |= 1 << i;
        d.discardNumberPart();
      }
    }
    // 仮数部はすべて詰め終わっており、dには0.xxxxという形でそれより下の小数部が格納されている
    // 最近接偶数丸め
    if (!d.isZero()) {
      d.multiplyByTwo();
      if (!d.isLessThanOne()) { // dは1.xxxxという形
        d.discardNumberPart();
        if (d.isZero()) {
          // ちょうど中間なので偶数になるように丸める
          if ((mantissa & 1) == 1) {
            mantissa++;
          }
        } else {
          // 0より遠い側なので最近接にするために仮数部を1増やす
          mantissa++;
        }
        if (mantissa == 0x800000) {
          // 仮数部が23ビットを超えている
          mantissa = 0;
          exponent++;
          if (exponent > 127) {
            return d.isNegative() ? Float.NEGATIVE_INFINITY : Float.POSITIVE_INFINITY;
          }
        }
      }
    }

    int bits = mantissa | (exponent << 23) | (sign << 31);
    return Float.intBitsToFloat(bits);
  }

今後の課題

冒頭にも書いたが、この実装はパフォーマンスを無視している。たとえば BigDecimal の演算はその桁数を \({n}\) とすれば毎回 \({O(n)}\) かかってしまう。したがって\({2}\)で割って\({2}\)未満にする操作は \({O(n \log n)}\) かかるので “1e+400000” みたいな文字列を与えられると処理が現実的な時間で終わらない。

また、これは手抜きなのだが E 表記や p 表記の指数部は Integer.parseInt(String) を呼んでいるだけなのでそこでオーバーフローする。

今回はGoのテストケースをそのままコピーしたが、これらの指数部が大きすぎるテストケースはコメントアウトせざるを得なかった。

ひとまず考えられる改善としては指数部のパース時にfloatもしくはdoubleで表せる範囲を超えていることが確実になった時点でパースを打ち切ることだろう。そのうえで無限精度の10進数型の演算についてはいくつかアルゴリズムがあるようなので、それを試してみようと思う⁴。

感想

というわけで、自分で浮動小数点数のパーサを書いてみた。ハマりポイントは最近接偶数丸めで仮数部が桁あふれをするところで、これはGoのテストケースを実行するまで気付かなかったので、自分で実装してよかったと思うポイントだ。

あと、自分でテストケースを書こうとすると、たとえば無限精度で \({2^{-53}}\) の値が欲しくなることがある。適当な電卓では表示が打ち切られてしまうので https://keisan.casio.com/calculator のような有効桁数を指定できる電卓を使う必要があった。

最後に、面識はありませんが、きっかけとなった記事を書いてくれたSukesan1984に感謝します。この記事が読者のなにかしら参考になれば幸いです。

たとえばJavaの浮動小数点数リテラル表記としては正しくない 1.p といった表記も今回は受容している。 ↩
厳密には無限精度である必要はないのだが、最終的に10進数表記でどれだけの有効桁数を考慮すればよいかというのはそれほど自明ではない。今回の実装では簡単のために無限精度で扱う。 ↩
0.15625 → 0.3125 → 0.625 → 1.25 → 0.25 → 0.5 → 1.0 → 0.0 ↩
有名なのは Will Clinger, “How to Read Floating Point Numbers Accurately”, ACM SIGPLAN ‘90, pp.92–101, 1990. らしい。 ↩

浮動小数点数の二段階丸め誤差

2020-10-18T01:21:55+00:00

さいきん『浮動小数点数小話』という同人誌を読んでFMA (Fused Multiply-Add)の二段階丸め誤差（double rounding error）について色々と知る機会があったのでまとめておく。ついでにFMAに関するOpenJDKのバグっぽい挙動を見つけたのでそれも併せて記しておく。

FMA (Fused Multiply-Add)とは

FMAは以下のような演算のことを呼ぶ。

\[fma(x, y, z) = xy + z\]

この演算自体は行列の乗算やベクトルの内積の計算でよく現れるものであるが、通常の浮動小数点数の乗算と加算を別々に行うと誤差が出るので一度の演算で正確な値を算出したいときに用いる。たとえばC言語（C99）では fma、fmaf、fmalという3つの関数が導入されているらしい。

FMAの実装における二段階丸め誤差

FMAはターゲットとなるCPUのアーキテクチャがFMA命令をサポートしていればその命令を直接呼び出すことで（バグがなければ）誤差なく求める答えを得ることができる。一方でそうでない場合はソフトウェア的にFMAをエミュレートしてやる必要がある。『浮動小数点数小話』では、高精度の型で演算して低精度の型に変換する実装をよくある実装ミスとして挙げている。

public static float(float x, float y, float z) {
  return (float)((double) x * (double) y + (double) z)
}

このコードは一見すると正しそうに見える。むかし授業で習った数値誤差の話でも計算過程で有効桁数の2倍を担保していれば計算で誤差が入らなかったような気がするし、実際、単精度（float）の桁数は24で倍精度（double）の桁数は53なので十分と思うかもしれない。しかし、これは無限精度で計算してfloatに一度だけ丸めたものとは結果が異なってしまう。

以下のコードを実行してみよう。

public class Test {
  public static void main(String[] args) {
    float x = 0x1.fffffep23f;
    float y = 0x1.000004p28f;
    float z = 0x1.fep5f;
    System.out.printf("%a\n", fma(x, y, z)); // 0x1.000004p52
  }

  public static float fma(float a, float b, float c) {
    return (float)((double) a * (double) b + (double) c);
  }
}

出力される結果は 0x1.000004p52 だが、これは本来の結果とは異なる。無限精度で計算すると x * y + z は 0x1.000002fffffffcp52 となり、これをfloatに丸めると 0x1.000002p52 となるはずだ。

この差がどこに由来するか考えると、じつは + (double) c の加算においてdouble型に丸めたときと、そこからさらに (float) でfloat型に丸めたときとで二段階に丸めていることが問題であることがわかる。つまり 0x1.000002fffffffcp52 -(double丸め)→ 0x1.0000030000000p52 -(float丸め)→ 0x1.000004p52 となっている。これを図示するとつぎのようになる。

二段階丸め誤差

図の数直線上の短い直線はdoubleで表せる実数を、長い直線はfloatで表せる実数を示している。無限精度での答え 0x1.000002fffffffcp52 はfloatの観点からは 0x1.000002p52 により近いが、doubleに丸めるときに 0x1.0000030000000p52 になり、さらにfloatに丸めるときは最近接偶数丸めにより 0x1.000004p52 になってしまう。なお、floatの仮数部は23桁なので 0x1.000002p52 の仮数部の最下位1ビットは 1 となることに注意。

OpenJDKのFMA実装のバグ

ついでなので、Java 9から追加された Math.fma(float, float, float) でどうなるかやってみる。

public class Test {
  public static void main(String[] args) {
    float x = 0x1.fffffep23f;
    float y = 0x1.000004p28f;
    float z = 0x1.fep5f;
    System.out.printf("%a\n", Math.fma(x, y, z)); // 0x1.000002p52
  }
}

こんどは 0x1.000002p52 と期待する結果が出力された。めでたしめでたし、となりたいところだが、じつはこの結果は環境依存である。もし使っているCPUアーキテクチャがFMA命令を実装していない場合は、おそらく現時点でのOpenJDKベースのJava（たとえばOracle Java 11.0.8）では 0x1.000004p52 と出力されるはずだ。試みにVM引数で -XX:-UseFMA と付けてみよう。おそらく 0x1.000004p52 という不正確な結果が出力される。

これはOpenJDKの現時点での実装が上で指摘されていたようにdouble型で計算してfloatに戻すという実装になっている（GitHubの該当個所）ためである。

Since the double format moreover has more than (2p + 2) precision bits compared to the p bits of the float format, the two roundings of (a * b + c), first to the double format and then secondarily to the float format, are equivalent to rounding the intermediate result directly to the float format.

コメントにはこのように書いてあるが、この (2p + 2) だから大丈夫という前提が間違っているように思える。OpenJDKには問題を報告しておいた（https://bugs.openjdk.java.net/browse/JDK-8253409）が、priorityも低いのですぐには直らないかもしれない（2021-03-22 追記：修正されたらしい。バックポートもされたらしいので最新版では直っているはず。ちなみに修正方法はBigDecimalを使うというもので面白みはないけれど、そうだろうなという感じでした）。

奇数丸めをつかった実装

さて、二段階丸め誤差を出さないFMAのソフトウェア実装はどうすればよいだろうか。前出の『浮動小数点数小話』によれば “Emulation of a FMA and Correctly Rounded Sums: Proved Algorithms Using Rounding to Odd” という論文に奇数丸めを利用した方法が紹介されているらしい。

これは中間計算を行う際に奇数丸めを常にして最終的な解は通常の最近接偶数丸めをすることで二段階丸め誤差をなくすという話である。実際にさきほどの例で考えると、無限精度での答え 0x1.000002fffffffcp52 をdoubleへ奇数丸めすると 0x1.000002fffffffp52 となるので、そこからfloatへ最近接偶数丸めをすれば 0x1.000002p52 となる。

これがうまくいくのは不思議だが、直観的には最近接偶数丸めで偶数側に寄りがちなのを奇数丸めでバランスを取るということだろう。あるいは、こうも考えることができる。奇数丸めをするということは、doubleの0x1.000002fffffffp52が表す範囲は [0x1.000002fffffffp52, 0x1.0000030000000p52) である。これによって本来の値が 0x1.0000030000000p52 より左ならfloatの 0x1.000002p52 に、右ならfloatの 0x1.000004p52 に丸められるので、最後に最近接偶数丸めをするときに 0x1.0000030000000p52 を飛び越すことがない。

奇数丸め

さて、奇数丸めをどう実装するかだが、論文によればDekkerのエラーなし加算器（error-free adder）を使うことでソフトウェア的に奇数丸めを実装できる¹。これはつぎのようなアルゴリズムで \({a + b}\) の結果floatに丸めたものを \({s}\) に格納しつつ、本当の値との誤差を \({r}\) で計算できる。そうするとオーバーフローやアンダーフローが発生しなければ \({a + b}\) と \({s + r}\) が厳密に一致することになる。

float s = a + b;
float z = s - a;
float r = b - z;

// a + b = s + r

あとは s の仮数部の偶奇と r の符号を見て奇数丸めを行えばよい。コードにするとこんな感じだろうか。

  public static float oddRoundedAdd(float a, float b) {
    float s = a + b;
    float z = s - a;
    float r = b - z;
    int sx = Float.floatToIntBits(s);
    if ((sx & 1) == 0 && r != 0.0) {
      s = Float.intBitsToFloat(sx + (s < 0.0 ^ r > 0.0 ? 1 : -1));
    }
    return s;
  }

以上をまとめて、論文に書かれているFMAのソフトウェア実装をJavaで書くとつぎのようになる。なおfloatのエラーなし乗算はdoubleを使って手を抜いている。

  public static float fma(float a, float b, float c) {
    float uh = (float) ((double) a * (double) b);
    float ul = (float) ((double) a * (double) b - uh);
    float th = c + uh;
    float tl = uh - (th - c);
    return th + oddRoundedAdd(tl, ul);
  }

ここで th と tl は c と uh のエラーなし加算の結果である。上記の実装で先ほどの例を実行すると正しく0x1.000002p52が出力されるので、たぶん合っているだろう。なお実際に実装する場合はオーバーフローやアンダーフローも気にする必要があるので、double版のFMAのようにBigDecimalでやってしまう方がらくかもしれない。

ところで、この実装のテストケースを作るのはすごく大変そうだ。floatだとちょうど結果が0.5ULPだけ離れたあたりになるようにサンプルをつくるのが面倒なのだ。doubleなら \({a = 1-2^{-27}, b = 1+2^{=27}, c = 2^{-150}}\)とでもすれば簡単につくれるのだけれど、floatは仮数部の桁数が奇数なのですこしめんどうくさい。

感想

浮動小数点はやはりおもしろい。やはり人間の直感とかなりずれるあたりがおもしろさだろう。floatの四則演算はdoubleを中間表現に使えば誤差なく計算できる、というのは定説であるし、実際に証明もされているが、FMAのような複数の四則演算の組み合わせになると成り立たない、というのは一見不思議にみえる。誤差のない演算を何回繰り返しても誤差が積もらない気がするからだ。しかし、よく考えるとfloat同士の演算をした結果はfloatで表せるとは限らず、さらにその数とfloatとの演算は、すでにfloat同士の四則演算の範囲を出ていると考えれば、「float同士の四則演算は」という部分が成り立たないので、これは矛盾しないわけだ。一方で、doubleは最終的な結果を出すのに十分な表現力を有しているので、途中の演算では奇数丸めを採用するというただそれだけで結果が保証されるというのもおもしろい。Dekker-Knuthのエラーなし加算器も不勉強にして知らなかったが、これもだいぶ興味深い。機会を見つけてもうすこし調べてみたいと思っている。

最後に、今回の記事は内容の多くを『浮動小数点数小話』に依っている。タイトルに惹かれてなんの気なしに購入したのだが、たいへん面白かった。著者の荒田さん、ありがとうございます。ここで謝意を表して伝わるか分かりませんが、執筆いただいて感謝いたします。なお、この記事に間違いがあった場合は当然ながら全面的に自分の責任です。気軽にご指摘ください。

https://link.springer.com/article/10.1007/BF01397083 ↩

中年プログラマの競プロ事始

2020-07-26T06:25:53+00:00

これはなに

自分がここ2年ほど趣味として競技プログラミング（いわゆる競プロ）をやった経緯と感想です。いわゆるプログラマの定年と呼ばれる35歳を過ぎてから始めたのですが、思ったよりも楽しめました。自分のようなシニアと呼ばれるプログラマが競プロに興味を持ってくれたらいいなと思って書きました。

競技プログラミングとは

競技プログラミング（以後、競プロ）は、プログラミングをして競うコンテストです。コンテストはたいていオンラインで毎週のように開かれており、誰でも参加できます。形式としては、与えられた時間内にいくつかの問題を解くコードを提出して、その正解数と提出までにかかった時間を競うというものです。たいていは、コードの実行時間および使用メモリに制限があり、その制限内で実行できるコードを書く必要があります。またコードが正解かどうかは出題者が用意したテストケースをパスするかどうかで判定されます。

多くのコンテストでは結果に応じて参加者のレーティングが変化し、参加者はレーティングを上げるために鎬を削る、という構図になっています。

始めた経緯と2年の振り返り

2年ほどまえに外資系の会社に転職しようとして始めました。その会社は面接対策用のドキュメントをリクルータが共有してくれるのですが、その中にコーディング面接の対策としてTopcoderのEasyの問題をウォームアップとして解くとよい、とありました。

Topcoderは海外の競プロコンテストですが、その過去問は誰でも見れます。ただ、自分は何を勘違いしたか、レーティングを上げてDiv. 1と呼ばれる上位のコンテストに参加できるようにならないとDiv. 1の過去問は見れないと思いこんでしまい、とりあえずレーティングを上げようと参加しました。

結果的にはその面接はうまくいかなかったのですが、競プロのおもしろさに気付き、また将来コーディング面接の対策にもなるかなと思って始めた次第です。

競プロを始めようと思い立って、まず選ばなければならないのがどのコンテストに参加するかです。Topcoderをそのままやってもよかったのですが、サイトが分かりにくいこと、開催時刻が日本時間に優しくないことにためらいがありました。

定期的にコンテストを開催しているサイトでは次のものがありましたが、この中ではAtCoderが日本時間に優しく、また素人目での判断ですが、いい問題が多いように思ったので、AtCoderに参加することに決めました。問題文が日本語かつ短めなので、とっつきやすそうに見えたというのもあります。

ほかにもGoogle Code JamやICFPCのように年に1回開催されるもの、1週間などの長期間かけてヒューリスティクスな問題を解くいわゆるマラソン形式のコンテストなどもあります。

さて、AtCoderに参加することに決めたわけですが、最初はAtCoder Beginner Contest（ABC）とAtCoder Regular Contest（ARC）の違いも分かっておらず、初めて参加したコンテストがARCで4問中1問しか解けなくて自分はこんなにできないのかと落ち込みました¹。

コンテストの違いが分かってからはABCに狙いを定め、最低月に1度は参加するという目標を立ててコンテストに参加しました。ABCは初級者向けのコンテストで現在はAからFまで6問の問題がほぼ難易度順に並んでいます。プログラマになって10年ほど働いたシニアな方だったら、おそらく問題AとBはすぐに解けて、問題Cはなんとか解けるくらい、Dは時間内だと厳しい、という感じではないでしょうか。

自分も当初はそのような感じでしたが、過去問を解いて勉強しているうちに、半年ほどで問題Dはほぼ見た途端に解けるようになり、そのあたりで水色レート（1200）に、最終的に2年かけて青レート（1600）に到達しました。2年間のレーティングの推移はつぎのようになります²。

自分の勉強法ですが、まず蟻本と呼ばれる『プロラミングコンテストチャレンジブック』を買い、初級編まで読みました。出てくるアルゴリズムは自分で実装して、自分用のライブラリを作っておくといいと思います。

あとはAtCoder Problemsというサイトを利用してひたすら過去問を解いて、解けない問題は解説を読むということの繰り返しです。なお、AtCoder Problemsはたいへんお世話になりました。過去のコンテスト問題一覧だけでなく、難易度で問題を絞ることもできるので便利です。他にも何日連続でAC（正解を提出することです）したかを表示してくれるStreakという機能があるので励みになります。

[asin:B00CY9256C:detail]

自分の場合は最初の壁がABCの問題Dだったので、最初は毎朝ABCの問題Dを1問解くことを目標にしました。数時間かけても解けないということはザラで、そういうときは解けるまで数日かけたりもしていました。ちまたの競プロの勉強法を見ると、簡単な問題をとにかく大量に解くことや、20分かけて解けなかったら解説を見ろ、というものが多いですが、自分はむかしから1つの問題を長い時間をかけて解くのが好きなので、効率は無視してそういう方法をとっていました。このあたりは向き不向き、好き嫌いが分かれるところだと思います。趣味なので、好きな勉強法でたのしく続けるのがよいでしょう。

問題Dがあっさり解けるようになってからは、問題EやF、あるいはそれと同程度の難易度の過去問を解いていました。また、蟻本の中級編を読み進めました。

それに加えて、解いた問題の解法や学んだ知識や証明をScrapboxにまとめていました。これは自分の考えを整理するうえでもとてもよかったですし、ときには記事を書いている最中に自分の証明に穴があることに気付いたりもしました。もしよければこういう記事を書いてみることをおすすめします。

他には制限時間内に解く練習をするためにAtCoder Problemsのバーチャルコンテストも利用しました。これは誰でも過去問をいくつか組み合わせてコンテストを作れる機能なのですが、有志によって「あさかつ」という名前のコンテスト（7/26はこれ）が毎朝開かれています。どうも制限時間内に解くのが苦手だと思ったので、時間内に解く練習にこのコンテストにしばらく参加していました。すでに知っている問題が出ることもありましたが、分かっている解法をさっとコードに落としこむ訓練になりました。

競プロをやってよかったこと

箇条書きに書いてみます。

問題を考えることがたのしい
ちょうどよい暇つぶしになる
容赦なく現実を突き付けられる

1. 問題を考えることがたのしい

そのまんまですが、自分は競プロのたのしさの大部分は問題を考察すること、解くことのたのしさだと思います。

これは自分の中のぼんやりしたイメージなのですが、自分が問題を解くときはこんなふうです。まず、問題というのはじっと見つめていても解けることはありません。手当たり次第に解法を試すのも（すくなくとも自分は）うまくいきません。そのかわり、シンプルな入力についてどうなるか手で確かめる、2次元の問題だったら1次元の場合を考えてみる、制約を外す、あるいは制約を足す、似た問題に変換できないか考える、問題を分割する、などなどといったことをします。

そのようにさまざまな角度から眺めると徐々に問題の輪郭がわかってきます。それはなにかよく分からない物体の表面を撫でている感じに近いでしょう。ずっと撫でていると次第に輪郭がわかっていき、いくつかの引っかかりが見つかります。そしてその引っかかりをうまく掴むことができれば、問題を理解することができ、そこからおのずと解法も導かれます。

この、引っかかりを掴む感覚がとても気持ちよい。これは数学パズルでも同じですが、問題の芯の部分、背骨をがっしり捉えることが大事で、なんとなく、こういう感じで解けるかなと解法ありきで考えると（すくなくとも自分は）必ず間違えるのがおもしろいところです。

さらに競プロの場合はアルゴリズムに落としこむという点で計算量やメモリの制約が効いてきます。たとえば、問題のサイズが小さいときは単純に3重ループで解ける問題があったとしても、問題のサイズが大きくなると飛躍的に難しくなる。同じ問題でも制約によって解き方がガラリと変わるのは競プロの魅力の1つでしょう。

2. ちょうどよい暇つぶしになる

これは自分だけかもしれませんが、歩いているときや電子レンジを待っているとき、温泉につかっているときに、なにか考えることがほしくなります。たとえば仕事で考えている問題だったり詰将棋でもいいのですが、競プロの問題というのは、問題を覚えることは容易で考えるのに時間がかかるという点で、まさにそのような暇つぶしにうってつけです。

コードを書いて確認するにはコンピュータが必要ですが、考えるだけなら紙とペンがあれば十分なので、たとえば旅行中のちょっとした時間や長距離フライトの機内で考えるのにもよいでしょう。

とある新潟の雪深い温泉で露天風呂につかりながら競プロの問題が解けるまで出ないぞと決心してずっと考えていたことがあるのですが、世界に自分しかいないような感じがしてとてもたのしかったのを覚えています。なお、解けたと思って部屋に戻ってから確認したら全然ダメだったのもいい思い出です。

3. 容赦なく現実を突き付けられる

現実は非情です。コンテストでうまくいかなければ、順位は悪くなりレーティングも下がります。多少の運もありますが、基本的には自分の実力通りの結果しか出ません。

時間が足りなくて焦ることもあります。ABCは100分ですが、6問すべてを解こうとすると、ほぼ寄り道している暇はありません。いつもはすんなり解けるはずの問題Cでつっかかって、そのつっかかったことに焦るということもあります。

これは10年くらいプログラマをやっているとちょっと新鮮です。というのは、それくらい経験を積むと、よくいえば総合力で対応、悪くいえば誤魔化しが効くようになるのです。シンプルに自分の一部の能力を評価されるということは減り、ほかの能力や経験でカバーすることを覚えていきます。これは悪いことではありませんが、ともすると自分ができる方なんじゃないかと錯覚してしまいます。

しかし競プロのコンテストに出ると、競プロという一点において自分よりはるかに出来る人たちを目の当たりにして軽く自信を喪失します。そういった経験を定期的にするということは、シニアな人ほど大事で得難いものであると思います。

コンテストに失敗した夜はとても悔しくて、なぜ解けなかったんだろうと歯噛みする経験も数えきれませんでしたが、それはよい刺激であったと思います。競プロに限らず、ある程度シニアな人はそういう機会を意識的に持つとよいかもしれません。

合わなかったところ

とくに自分にとって競プロが合わないというか、むずかしいなと思うことはつぎのものでした。

参加時間帯が厳しい
早解きに興味が持てない

1. 参加時間帯が厳しい

ABCは土日どちらかの21:00 - 22:40というスケジュールですが、家庭持ちにとってはやや辛い時間です。外食すると21:00に帰ってくることは難しいですし、家で食べるとしても自分は家人に料理してもらっているので夕食の時間を調整してもらわなければなりません。

このあたりは家族の理解を得て、月に1回程度という頻度だったのもあってなんとかなりましたが、一人暮らしの方がもっと楽だろとう思います。

なおCodeforcesのコンテストは23:30に始まることもあるので、夜型の人はそちらが都合いいかもしれません。

2. 早解きに興味が持てない

これは、ほぼ愚痴ですが、自分はあまり早解きは得意ではありません。頭の回転が遅いのは確かなので単純に不得手のようです。自分はどちらかというと1週間でもずっと同じ問題を考えるのが好きで、そのせいか、あまり早解きのテクニックを磨くのに興味を持てませんでした。また、数学的に自分の解法が最適であることを証明しようとして、むやみに時間をかけてしまうこともありました。

これはとくに問題セットが易しめのコンテストではかなり不利です。とはいえ、趣味でやっているものなので、自分はこういうスタイルで楽しもうと割り切って、早解きは諦めて参加していました。

なお、いままで参加したことはほぼないのですが、マラソンコンテストやヒューリティクスコンテストと呼ばれるタイプのコンテストだと、また事情は変わってくるかもしれません。

よくある想定質問と回答

最後に、シニアプログラマから受けそうな競プロについての想定質問とそれに対する自分の回答を載せます。なかには実際に受けたことがある質問も入っていますし、自分が競プロをやる前に抱いていた疑問もあります。

Q. コーディング面接で有利ですか？

端的に言えばYesです。

経緯で、とある外資系の企業のコーディング面接のために始めたと書きましたが、その企業からは1年後にまた受けないかというお誘いを受け、2回目では通りました。この会社はコーディング面接の比重が高く、面接では競プロの知識と技術は有利に働いたと思います。とはいえ、AtCoderのレーティングでいえば、水色くらいあれば十分だと思います。

また、自分は個人的な信条から利用していませんが、コーディング面接に特化した問題を提供しているサービスもあります。競プロをやるよりそっちの方が効率的だといわれたらそうかもしれません。

ただ1つ言えることは、コーディング面接で出そうな問題を片っ端から解いて解法を暗記して、運良く面接に通ったとしても、それはプログラマとしては得るものが少ないだろうということです。

それよりも、問題をどう理解するか、アルゴリズムをどう問題に適用するかといったことを競プロを通して学べれば、コーディング面接に通ること以上の糧になるでしょう。老害っぽい物言いですが、コーディング面接に通ることだけを目標に競プロをやるのはややもったいないと思います。

Q. 業務で役に立ちますか？

直接的に役立つことはそれほど頻繁にはないでしょう。前職では、たまたま競プロの知識が直接役立てられそうなタスクがあったのですが、とてもいい経験になりました。

その経験をまとめた記事：動的計画法によるDVDのディスク分割の改善

とはいえ、こういうタスクが頻繁にあるかというと、仕事にもよりますがふつうはそんなにないでしょう。とくに短時間のコンテストに出てくるような問題はどちらかというと数学パズルに近く、業務で扱う問題とはやや方向性が違うといえます。

ではまったく役に立たないかというと、そんなことはありません。たとえばアルゴリズムをいくら学んでも、それを問題に適用できるかどうかはまた別の話です。競プロをやることによって、そのあたりの嗅覚は鍛えられるように思います。また、頭に浮かんだアルゴリズムをコードに落としこむところも、バグなく実装するにはある程度の慣れが必要です。たとえば二分探索は誰でもアルゴリズムは知っていますが、バグなくシンプルに書くにはちょっとコツがいります。しかし、ほとんどの教科書はアルゴリズムの概要や疑似コードだけ書いて細かい実装の留意点までは書いていません。これも実際に競プロに取り組んで始めてわかったことでした。

競プロと業務の関係は、将棋で例えると詰将棋と実戦の違いのようなものかもしれません。詰将棋だけ強くても実戦が強いとは限りませんが、それでも実戦で間違いなく役立つ能力です。競プロもすぐに役立つわけではありませんが、ある程度やると業務でも「あ、これはこういうアルゴリズムが適用できそう」という問題が見えるようになります。そういうチャンスを得やすくなるという意味でも有用なのではないかと思います。

なお余談ですが業務ではNP困難かどうか見抜くことがたまに求められます。言い換えると、ある問題の最適解を現実的な時間内に得る方法があるか、それともヒューリスティクスに近似解しか得られないのかを判断する必要に迫られることがあります。これは競プロのコンテストではあまり求められないことの1つな気がします³。

個人的には”The Algorithm Design Manual”という本でそのあたりは勉強してとてもためになりました。とてもいい本なので、興味がある人はぜひ読んでみてください。”War Story”という筆者の経験談コラムもおもしろいですし、内容はやや古いですが、とても実際的な内容だと思います。なお日本語訳は評判が悪いので自分は英語版を読みました。また、辞書的に使う本なのでKindleよりは紙版の方が読みやすいかもしれません。

[asin:1849967202:detail]

Q. 競プロerはコードが汚い？

これはたまに同世代のソフトウェアエンジニアから聞く話です。「競プロをやっていた人はコードが汚いので採用したくない」と言い放っていた同世代のエンジニアも見たことがあります。

とりあえず、自分のコードは汚くないと信じています。そして、まわりに競プロをがっつりやっている同僚がいたことがないので、自分のこの質問に対する答えは「分からない」です。

たとえば競プロのコードでは時間的な制約もあるため i や j などの1文字変数を多用しますし、人によってはメソッド名もかなり適当です。では業務でそういうコードを書くかといったら、そういうことはないでしょうし、そういうコードがあったらレビューで指摘すればよいことです。レビュー上のコミュニケーションに難があるとしたら、それはおそらく競プロとはまた別の問題でしょう。

もう少し本質的な問題として、競プロで書くようなコードが他の人にはぱっと理解できない可能性はあると思います。たとえば、整数 a を b の倍数へ切り下げるのを a / b * b と書いたり、切り上げるのを (a + b - 1) / b * b と書くのは競プロに慣れている人にはぱっと分かるかもしれませんが、慣れていない人には分からないかもしれません。あるいは動的計画法を知らない人にいきなり動的計画法のコードを見せたら、たぶん理解できないと言われるでしょう。

ただ、これも競プロどうこうよりは、どういうコードを「読みやすい」とするかの合意を得る問題でしょう⁴。競プロに限らず、たとえばReactのようなフレームワークに慣れているかどうか、関数型プログラミングの経験があるかといったそれぞれのバックグラウンドによって「読みやすい」コードは異なります。このあたりのコミュニケーションは経験によって得るものなので、もしかすると競プロだけやってチーム開発をやったことがない人は不得手なのかもしれません。

それでも、できることなら面接官を担当する方は「競プロをやっていた人だから」と色眼鏡で見ないでくれるといいなと思います。それよりも、自身で競プロを経験してよりよい面接の形式や採用基準を考えてみるのはいかがでしょうか。

なお、自分が前職で書いた動的計画法のコードは、コメント以外に解説記事を書いて、できるだけ動的計画法を知らない同僚も理解できるように努力しました。

Q. 家族とくに子供がいてコンテストに参加できないんだけれど？

ちいさい子供がいると、おそらくコンテストに出るのはほぼ不可能だろうと思います。Codeforcesのように日本時間深夜に開催されるコンテストもありますが、120分程度とはいえ、そのあいだは一切邪魔が入らない環境が必要ですし、勉強する時間も取りづらいと思います。

自分は子供を持ったことがないので推測でしかいえませんが、たとえば、子供の面倒をみているときに問題を考えることはできるかもしれませんし、コンテストに参加しなくても、隙間時間で過去問を解いたり本を読んで勉強することはできるかもしれません。

そして機会があればぜひコンテストに参加してみてください。コンテストはコンテストで楽しいものです。

最後に

冒頭にも書きましたが、この記事は自分のようなシニアなプログラマが競プロに興味を持ってくれたらと思って書きました。

自分が学生のころは競プロはまだそれほどメジャーではなく、CS専攻でなかった自分は存在も知りませんでした。一方でいまは競プロがメジャーになったものの、どちらかというと若い人、とくに大学生がもっぱら参加しているイメージです。

しかし、そういったことに気後れせずに参加してみると、シニアはシニアなりにたのしめることに気付けるのではないかと思います。なにより、シニアにとっては就活を気にせずに純粋に競プロを楽しめるというアドバンテージがあります。もし興味をもったらぜひ趣味として始めてみてください。

さて、自分はというと、競プロを2年前に始めるときに「AtCoderで青レートになる」を目標にしたのですが、それを達成したいまはつぎをどうしようかなと考えているところです。ここ数ヶ月はスプラトゥーン2にハマっていてほとんど競プロをやっていなかったのですが、つぎにやるならCodeforcesに参加するか、ヒューリスティクスコンテストに参加しようかと考えています。

ABCの方が初級者向けでARCの方が上級者向けです。一般に問題の難易度もARCの方が高いです。 ↩
途中で3ヶ月くらい空いているのは2回目の転職活動で忙しかったためです ↩
自分が知らないだけで、もしそういう問題があるなら教えてください ↩
個人的にはコードを「読みやすいかどうか」判断するのはそんなに簡単なことではないと思いますが、その話はまたの機会に。 ↩

近況報告

2019-12-15T22:08:13+00:00

TL;DR

先月中旬にmixiを退職してGoogleに転職しました
引き続きAndroidアプリを作っています
mixiのみてねチームもとてもいいところなので、興味がある人はぜひ

11月の中旬からGoogleでソフトウェアエンジニアとして働いています。勤務先は引き続き渋谷で、やっていることもAndroidアプリを作っているのでそんなに変わっていません。よいチームに巡りあうことができ、毎日たのしくやっております。一方で上司も含めてチームに日本語話者がほぼいない状況は初めてで、自分の英語のできなさを噛みしめつつ、がんばっています。

mixiのみてねチームはとてもいいチームでまったく不満はなかったのですが、将来的に海外で働くことも視野に入れたいと思っていたタイミングでお話をいただいたので決断しました。みてねは大企業の新規事業部でしたが、POの笠原さんとさえ話をつければ物事が進むところや個々に大きな裁量が与えられるところなど、スタートアップ然としていて楽しかったです。メンバーもよい人たちばかりで、互いに敬意を持って働けるよいチームでした。興味がある方はぜひ募集ページをご覧ください。

今後ともよろしくお願いします。

『データ指向アプリケーションデザイン』を読んだ

2019-09-23T02:37:12+00:00

『データ指向アプリケーションデザイン』を読んだ。たいへんおもしろかった。技術書でこんなにわくわくしながら一気に読んだのは『Androidを支える技術』以来かもしれない

本書はソフトウェアシステムの設計について「データ」という観点からまとめたものだ。もちろんデータベースは登場するが、それだけでなくJSONなどのデータ形式、RPC、メッセージキュー、全文検索インデクス、バッチ処理やオンライン処理も等しく「データ」という観点から扱っている。特筆すべき点は、理論だけでなく実際のミドルウェア製品を引き合いに出しつつ具体例を混じえて解説している点だろう。地に足がついた、かといって個別詳細に立ち入りすぎず、一歩離れたところから中立的に包括的に解説する姿からは、筆者の多くの技術への深い理解と経験が窺える。

本書は3部構成になっているが、自分の中では白眉はやはり第5章から第9章までの第2部「分散データ」だといえよう。一見簡単そうで、実はとても大変な（！）「レプリケーション」から始まって、章が進むにつれて、それまで漠然と分かっていたつもりになった「一貫性」とはなにか、「耐障害性」とはなにか、信頼できない要素を組み合わせて信頼できる技術にすることがいかに大変か、といったことが順に明らかになっていく。最後の第9章「一貫性と合意」はそれまで扱っていた別々の概念が実は等価であったことが示される章であり、自分のようなこの界隈に無知な人間は、エレガントな数学の定理の証明を読んでいるようで興奮が抑えられなかった。

自分が本書のもっとも気に入っている点の1つは明快さだ。概念をあらわす単語は慎重に選ばれ、たとえば「一貫性」が意味するところのものが前出のものと異なる場合はきちんと断りがつく。それによって、読者が分かったような分からない気持ちになるのを防いでくれる。反面、その概念をきちんと身体に染みこませずに次に進むと、おそらく何を言っているか分からなくなるだろう。もしそのような事態になったら、臆することなく前ページにもどって確認することをおすすめする。この本はそれだけの深い理解をする価値のある本だ。

ところで、自分の無知ゆえかもしれないが、ちょうどNoSQL系のミドルウェアがもてはやされていたころから、自分はどうもその界隈のバズ用語が満載の説明に胡散臭さをおぼえていた。「CAP定理」や「結果整合性」といった言葉で優位性を説明されても、それらの技術の限界が腑に落ちなかったからだ。本書は「CAP定理」を『したがって、 CAPは歴史的には大きな影響力があったものの、システムの設計における実際的な価値はほとんどないのです』（9.2.4.1 CAP定理）と切って捨て、より厳密な「線形化可能性」や「全順序」といった概念を中心に、定理にもとづいて説明が進んでいく。この真摯さ、明快さ、厳密さがうまい具合にブレンドされていることは本書のもっとも優れた点だと思う。

最終章12章では、それまで筆者があえて守っていた中立さを捨て、自分の考えを述べている。やや散漫な印象もあるが、おもしろく読める章だ。筆者の個人ブログを読んでいるような気になる。なかんずく「12.4 正しいことを行う」は、筆者の強い思いが伝わる節であった。その主張に賛成であれ反対であれ、本書を手にとったソフトウェアエンジニアはぜひこの節まで読んでいただきたいと思う。データをどう扱うか、ということを考えてきた筆者の声だけに耳を傾ける価値はあると思う。

最後になったが、和訳の素晴しさを述べて終わりにしたい。本書は先にも述べたとおり、レンガを1つ1つ積んでいき1つが合わないと全体が崩れるような、そんな厳密さを持ったものである。それぞれの概念をきちんと理解していないと、このような文章は正確に訳せないだろう。自分は「原文を読んで意味を確認したい」と思った箇所に線を引く癖があるが、本書ではわずか数カ所であった。訳者の方は本書の内容を理解し、必要とあらば参考文献にあたって、理解を深めたうえで、適切な翻訳にしてくださったものと思う。いち読者としては今後もぜひ翻訳者として活躍いただきたい。