本当はすぐに新小判切手の残りの額面の調査に戻る予定だったのだが、思いの外難航している。【前編】風景2銭切手を平面版と輪転版に分類してみたに続いて、風景2銭切手の8枚を平面版と輪転版に分類してみた。
調査方針
後編では次の再調査をする。調査対象は前編と同じ8枚とし、この項目が全て同じになれば自信を持って平面版、輪転版と言えるのだが、結果はいかに。
- 印刷面の短辺の長さをAIで測定し、平面版と輪転版とに分類する。
- 印刷面の特徴をAIで調査し、平面版と輪転版とに分類する。
- 写真を目視でみて、平面版と輪転版とに分類する。

印刷面の短辺の長さをAIで測定
AIで印刷面の短辺の長さを測定するにあたり、今度はキチンとプロンプトを作り込んでみた。ポイントは消印やインクの滲みの影響を排除した測定をすることである。そのためには次の5段階の処理によって短辺の数値を求めると良いようだ。
- 緑抽出
- 赤・黒消印除外
- エッジ中央値
- 中央80%直線フィット
- 短辺を測定
結果はこんな感じ。写真番号は左上から右、右下から右の方向に番号を振った。最初は計測値的に明らかにゴミか消印を拾ったと思われる切手もあったが、影響を排除する処理を加えて再度計算しなおしたら8枚の切手を2個のクラスタに分類することができた。この2カテゴリのうち、短辺が長いクラスタを平面版、短いクラスタを輪転版としてまとめたのが下の表。こちらの手作業による分類は1~5が平面版、6~8が輪転版だったので結果は違っていた。
| 写真番号 | 印面枠短辺(mm) |
|---|---|
| 1 | 平面版 |
| 2 | 平面版 |
| 3 | 輪転版 |
| 4 | 平面版 |
| 5 | 輪転版 |
| 6 | 平面版 |
| 7 | 輪転版 |
| 8 | 輪転版 |
印刷面の特徴をAIで調査
続いて、前編で調べた平面版と輪転版の見分けやすい観察場所を使ってAIで評価する。具体的には下記の3箇所と、これらの紙繊維への追従を調べることになる。それらの詳しい判定基準は【前編】風景2銭切手を平面版と輪転版に分類してみたを参照。
- 菊花の放射線の安定性
- 山の横線の保持
- 文字(逓・信・2)の角の締まり
この3箇所の特徴を調べてクラスタリングするためのプロンプトを作り込む。プロンプトを作り込むにあたり、どういうところを気をつければ良いかAIに質問すると、どうやれば良いかAIが教えてくれる。基本的にはそのやり方に従って評価項目を定めて測定する。このとき気をつけることは、できるだけ再現性が高く、定量的評価をしやすい基準を作ることである。文字で書くと難しいが、AIに聞けばこれも最もらしい定義を作ってくれた。
続いて、観察場所は、1枚の切手に対して菊の模様、富士山、文字「銭弐」、文字「2」、文字「SN」がそれぞれ写った合計5枚の中解像度の写真を用意し、観察場所ごとに8枚の切手の写真を一斉に入力し、横並びで比較した。参考までにAIで短辺の長さを図った結果、平面版となった2番の切手と、輪転版となった8番の切手の写真はこんな感じ。




各観察場所の全体的な印象を10段階評価した結果はこんな感じ。肉眼では2番の切手は平面版の特徴が、8版の切手は輪転版の特徴である輪郭が甘い印象と、輪郭が鋭い印象がよく出ていそうなのだが、どんなに作り込んでも観察場所によって評価が変わってしまう。いくらやっても評価が安定しないので一旦終了。
| 写真番号 | 菊の模様 | 富士山 | 文字「銭弐」 | 文字「2」 | 文字「SN」 |
|---|---|---|---|---|---|
| 1 | 5 | 6 | 6 | 5 | 6 |
| 2 | 7 | 6 | 6 | 8 | 7 |
| 3 | 7 | 7 | 8 | 7 | 8 |
| 4 | 6 | 6 | 4 | 7 | 5 |
| 5 | 4 | 8 | 4 | 7 | 5 |
| 6 | 5 | 7 | 7 | 7 | 4 |
| 7 | 8 | 5 | 2 | 5 | 4 |
| 8 | 8 | 4 | 8 | 4 | 2 |
目視で再度分類
ここまで来ると目が肥えてきた気はするのだが、AIでの調査結果と同じく、観察場所によって平面版にも輪転版にも思えてきて、全体的にどうなのかという評価を下せなかった。この手の印象を評価するのはとても難しく、目視での再分類も断念することにした。
まとめ
AIによる安定しないのはプロンプトが悪せいで、全ての写真に対して統一基準で評価ができていない可能性が高い。もう少し精度をやるためには、肉眼で見たこの差がわかりやすい位置と判断ポイントをAIに対して伝えていく必要がありそうだ。ただ、気になることもあって、線を見ると明らかに鋭そうに見えるのに、文字の端点は丸みを帯びていたりするので、これが版に対してどういう意味を持つのかがわからない。つまり、正解がわからない状態で作り込むとなかなか完結しないので、まずは確定標本を揃える必要がありそうだ。
また、印刷面の短辺の長さをAIで測定する方法だけは最もらしい値を計算することができたが、AIの評価結果の信頼性が上がっていないので、印刷面を見た評価による裏付けができなかった状況では追加調査が必要そうだ。また、今の情報だけでは印刷面の特徴を見て平面版と輪転版とに分類するのは難しい。追加情報を集めてから版分類を再挑戦したいと思う。

