日本国の裁判所にcontributeしました
要約
裁判所が公開している裁判例検索に「年月日の数字がマイナスになっている」というバグが複数存在していることを発見したため、最高裁判所に報告し修正してもらいました。
存在していたバグ
次の画像では「原審裁判年月日」という項目が「昭和-954年3月25日」という表記になっています。年月日がマイナスになることはありえず、明らかに誤表記です。
このような年月日にマイナスの値が出現している判例データは複数あり、確認した限りでは以下の7つです。
発見の経緯
裁判例のテキストデータを作成しようと考え、裁判所のホームページをスクレイピングして対象の裁判の情報を抜き取ってデータ化するソフトウェアを作成しました。その一環で、このソフトウェアには和暦の年月日をパースして構造化する機能をつけていました。
2023年1月15日にこのソフトウェアを動かしていたところ、このような不正な値をが含まれるページを解析しようとしてクラッシュしたことにより、発覚しました。
発見時のツイートの様子
「 昭和-954年3月25日」が発生してやがるhttps://t.co/1q6XBMbiew
— ぷり (@puripuri2100) 2023年1月15日
本バグを発見した後も引き続き公開されている全ての判例ページのスクレイピングを行い、他に同様な状態になっているページが無いかを調べ、最終的に上記の7つのページで不正な年月日の表記になっていることを確認しました。
バグの報告
このバグはソフトウェア側で対処できるものではなく、放置しておくことは公共の利益を損なうものであることから、裁判所に報告をする必要があると考えました。
裁判所のホームページから辿れるお問い合わせページでは
その他本サイトの利用方法,操作方法等について 最高裁判所事務総局広報課 TEL03-3264-8111(内3156)
と記載があることから、2023年1月16日にここに電話をかけて本バグについて報告をしました。
その結果、電話に出ていただいた職員の方から
たしかにこれは明確におかしいですね。 直せるかわかりませんが担当者の人に伝えます。
との返答を受けました。
修正
報告した数日後に修正されました。例えば
のように、「昭和-861年7月31日」となっていたところが「昭和39年7月31日」と修正されています。
修正前のページのアーカイブが2023年1月16日で、修正後のページのアーカイブが2023年1月18日です。連絡をしてすぐに直してくれたことがわかります。
結末
本バグ発見のきっかけとなったソフトウェアはこちらです。
また、このソフトウェアを使用して作成した判例のデータ群はこちらで公開しています。