13日 5月 2026

AIは論文を評価査読できるか

　多人数の学生のレポートを一気にAIが評価できるか試してみたが結果は散々だった。135人分10万字以上を統合したが、同じテーマならまだしも、自由に複数のテーマを選ばせると、名前と内容を取り違え、タイトルがあるのに、テーマを間違える等が多い。そのため、チェックにかえって時間がかかる。また、全般的に最大公約数的抽象的一般的な、言わば、いかにもAIが書きそうな優等生的なレポートを好み、個性的な工夫があるものを嫌う。ユニークな素晴らしい事例ほど、過去の文献にないため評価できないようだ。このため、Ｂ+やA-くらいが多く、S評価は全くない。また、理解としては、少しズレているが、却って、それが本質を突くような論考をするものも除外され逆評価である。いわば社会主義全体主義的な模範答案のみ高く評価するイメージだ。

さらに、図表は全く無視するし、字面や見栄えも考慮しない。確かに文章の流れだけである。こちらが丁寧に壁打ち、何度も学習、啓蒙。洗脳をすると、次第に「理解」が深まるようで、こちらの評価と近くなる場合もある。

全文はこちら

カテゴリ：若様のブログ～辛口アナリストが斬る, 2026年4～6月