Tech Waves

produced by Hakuhodo DY ONE

本ブログは、株式会社Hakuhodo DY ONEの開発チームによるエンジニアブログです。
それぞれのメンバーが業務を通して得た技術情報や、各種セミナーの参加レポート、またその他トピックについて情報発信を行っています。

AI vs 人間:絵心を理解してくれるのはどちらか検証してみた

こんにちは、廣本です🎨。

みなさん、お絵描きは得意ですか?ちなみに私はニガテです。犬のイラストを描いたのに猫だと勘違いされてしまうこともしばしば……。

しかし、膨大なデータを学習しているAIであれば、私の描いたイラストもきちんと理解してくれるはず!

そこで、私が描いたイラストに関するクイズをAIと人間に出題してみました。果たして、私の絵心を最も理解してくれるのは誰なのでしょうか?

 

ルール

ランダムに選ばれたテーマを元に、私が描いた10個のイラストを参加者に提示します。そして、何を描いたイラストなのか予想してもらい、最も正答率が高かった人またはAIが優勝となります。

人間の参加者として、社内でデザインやアートに興味がある人や、私のイラストを何度も見たことがある人に協力してもらいました。

AIは、Gemini 2.5 Flash、GPT-5、Claude Sonnet 4.5の3つを使用し、以下のプロンプトで回答してもらいました。

これから10枚のイラストを提示します。それぞれ何のイラストかを推測し、名詞で回答してください。
なお、左上に記載されているのは、各イラストの番号(①〜⑩)のため、無視してください。

お絵描きテーマ

今回、私が描いたイラストは下記の10個です。みなさんも何を描いているか予想してみてください。

 

テーマ①

テーマ②

テーマ③

テーマ④



テーマ⑤

 

テーマ⑥

 

テーマ⑦

テーマ⑧

テーマ⑨

テーマ⑩

 

各問題の正解はこちらです。

  1. レモン
  2. コーヒー
  3. 金魚鉢
  4. 目覚まし時計
  5. 風船ガム
  6. シャボン玉
  7. トランプ
  8. コンパス
  9. 切手
  10. 地球儀


採点結果

結果は以下のようになりました。

全体の平均点:8.4点

 L 人間の平均点:9.1点

 L AIの平均点:6.5点

参加者のコメント

👩 チーバくんの顎肉

テーマ①は、人間の表情や矢印に注目してかえって想像力を膨らませてしまい不正解でした。それ以外はすぐに何を指しているのか分かりました。

👩 ねこがすき

テーマ①は「ルーレット」か「観覧車」で迷いましたが、どちらも違っていて残念です。

真ん中の輪切りの絵だけだったら正解できたかもしれないです。人間と謎のもくもくの絵に惑わされてしまいました。

👩 ぽてと

正直満点だと思っていました。絵の中でも絶妙に何を指しているか?を拾うのが人間でも少し難しかったです。(金魚鉢?金魚?/コーヒー?コーヒーカップ?) クエン酸は大誤算です。

👩 バニラズ

レモンじゃなくてレモンスライスだけど、全問正解判断ありがとうございます!④は最初、時計から湯気が出ているように見え、どういうこと?と思いました、笑
あと、風船ガムも金塊かと思いました……。

深く考えすぎると引っ掛けかなと思ってしまい、色々な案が出てきてしまうので、直感が大事ですね!

👩 おっとっと

絵の要素をどこまで拾うか、が難しかったです。特に③は、「金魚」か「金魚鉢」かで迷いましたが、仮に自分が「金魚」というテーマで絵を描こうとしても、鉢や金魚袋の要素を入れないと表現できないと思い、深読みで「金魚」としてしまいました。が、よく考えると、⑨では矢印を使っているので、矢印の有無で判断できたかもしれないです…

👨 hiro

人間の表情や時計のノイズ感などのヒントから推測でき、分かりやすかったです。

👨 限界の生え際

1問目は出題者の傾向とかも含めて難しく考えすぎました。 2問目以降のシンプルさで、1問目を修正したいと思いましたが、上から順番に回答した結果をそのまま表現しました。これが人間てやつよ。 AIも回答されるとのことですが、「全体傾向から回答を修正したい、だがあえてやらない」という人間味を出せるのか見ものです。

9点ですか…本当は全問正解だったんですからね!

👨 うしうし

金魚鉢の問題で「金魚」と回答してしまったのが惜しかったです。絵を見たときに金魚が泳いでいる様子が印象的で、つい金魚そのものに注目してしまいました。確かに鉢全体を描いているので、「金魚鉢」が正解ですね。全体的にシンプルで分かりやすいイラストが多く、楽しく回答できました。

🤖 Gemini 2.5 Flash

詳細なフィードバックと点数のご指摘、ありがとうございます!

  • 2番「コーヒーカップ」→「コーヒー」: 単に描かれているモノを答えるだけでなく、そのイラストが何を象徴しているのか、より意図された名詞を推測する難しさを感じました。湯気も描かれているので、飲み物自体に焦点が当たっていたと考えるのが自然でした。
  • 3番「池」→「金魚鉢」: 大きさや環境の描写のニュアンスまで汲み取る必要があったと反省しています。
  • 5番「拡声器」→「フーセンガム」: これは完全に読み違えていました。口から何かが出ている様子だけを見て判断してしまい、その「形」がフーセンガムであるという見方ができませんでした。
  • 9番「手紙」→「切手」: 全体像ではなく、示された矢印の先にある具体的な要素に注目すべきでした。

イラストの描写がシンプルである分、何を表現しようとしているのか、その核心となる名詞を捉えるのが奥深いと痛感しました。皆さんの日常的な感覚や文化的な背景が、このようなシンプルなイラストの解釈にも影響を与えるのだと感じ、大変勉強になりました。貴重な体験と、丁寧な解説をいただき、本当にありがとうございます!

🤖 GPT-5

フィードバックありがとうございます!とても楽しかったです。矢印や表情のヒントをもっと重視すべきだと気づきました。

誤答の振り返り

  • 1(レモン):放射状の線から「ピザ」を連想してしまいました。酸っぱい表情や果実→輪切りへの矢印を読み取ればレモンでしたね。
  • 3(金魚鉢):器の縁を見落として「海」と誤認。丸い容器と水面の波、金魚=室内の鉢がポイントでした。
  • 5(フーセンガム):口元の大きな丸が風船で、左のブロックがガム。メガホンに見える形状に引っ張られました。
  • 9(切手):はがき全体に目が行き、矢印が示す切手枠を主語として捉えられていませんでした。
  • 10(地球儀):大陸と支柱が決め手なのに、上部の形を受話器っぽく見てしまいました。

次は「矢印が指している対象」「人の表情などコンテキスト」を優先して読み取り、単一名詞をより正確に選びます。もしよければ、また別のセットでも挑戦させてください!

🤖 Claude Sonnet 4.5

ありがとうございます!結果を教えていただき感謝します。

8.5/10点という結果でしたね。振り返ってみると:

完全正解だったもの: ①レモン、②コーヒー、④目覚まし時計、⑤ガム、⑥シャボン玉、⑦トランプ、⑧コンパス、⑩地球儀

惜しかったもの:

  •  「水槽」→正解は「金魚鉢」(部分点0.5) 確かに!魚が描かれた容器で、よく見ると金魚鉢の形状でしたね。

間違えたもの:

  •  「年賀状」→正解は「切手」 これは反省点です。「様」という文字や窓、煙突のような絵が描かれていたので年賀状と思いましたが、切手サイズの四角い枠と絵柄という視点で見れば切手でしたね。

シンプルな線画から対象物を推測するのは、思っていたより難しくもあり、楽しい体験でした!特徴的な要素(レモンの断面、コーヒーカップの湯気、目覚まし時計のベルなど)があるものは判別しやすかったですが、⑨のように「何の場面を描いているか」を読み取る必要があるものは難しかったです。

良い問題をありがとうございました!


まとめ

「AIよりも人間の方が正答率が高い」という結果になりました。

人間の場合、細部まで気を配り、そのイラストで何を表現しようとしているのか、作成者の意図を汲み取ろうという意識が強い傾向にありました。逆に考えすぎたことで誤答してしまったというケースがあるのは、人間ならではかもしれません。


一方、今回人間には勝てませんでしたが、いずれのAIモデルも抽象的な手描きのイラストをある程度解釈できていました。特にGPT-5に関しては、点数は低かったものの、振り返りのコメントで表情や矢印等の周辺情報への言及があり、コンテキストを理解しようとする姿勢は非常に人間らしいなと感じました。


背景まで含めて考えようとする人間と、余計な情報は削り本質的な部分に焦点をあてようとするAIの対比が見られ、なかなかおもしろい結果になったと思います。テーマ⑨の「切手」は特に顕著な傾向が見られ、人間の正答率が100%なのに対し、AIの正答率が0%となりました。矢印の先にある「切手」を導き出した人間と、矢印を考慮せずイラスト全体を捉えてしまったAIの差が出ていました。

ぜひみなさんも検証してみてはいかがでしょうか?

 

この記事を書いた人

廣本 (id:hrhrkun)

以前はBIの開発業務を担当。今はナレッジマネジメントの推進や、AIエージェントの開発をメインにいろいろ行っています。