なぜ今、AI文章の見分け方が重要なのか
2023年以降、ChatGPTをはじめとする大規模言語モデル(LLM)の普及により、AI生成テキストはあらゆる場面に浸透しています。ビジネスメール、マーケティングコンテンツ、学術論文、さらにはWikipediaの記事にまで。
問題は「AIを使うこと」自体ではありません。AI生成テキストが無批判に流通すると、事実誤認(ハルシネーション)の拡散、出典の捏造、均質で深みのない文章の氾濫といった問題を引き起こします。
WikipediaではWikiProject AI Cleanupというボランティアグループが、AI生成記事の検出・削除に取り組み、500以上の記事をレビューしてきました。その過程で体系化された「AI文章の特徴」は、Wikipedia以外のあらゆるテキストにも当てはまる知見です。このガイドでは、その知見を日本語話者向けに整理します。
このガイドの情報源
- Wikipedia: Signs of AI writing — 編集者コミュニティが特定した24の言語・フォーマットパターン
- Wikipedia: WikiProject AI Cleanup — AI生成コンテンツの検出・削除プロジェクト
- blader/humanizer・humanizer_academic — Claude用スキルとして実装されたAI文体検出チェックリスト
- m0370氏のZenn記事「AI生成文から『AIくささ』を取り除く技術」— 日本語への適用事例
語彙パターン — AIが好む単語
LLMは訓練データの統計的傾向から、特定の単語を不自然に高い頻度で選択します。これらの単語は個々には正しい英語・日本語ですが、出現頻度が人間の書く文章と明らかに異なります。
英語のAI頻出語彙(GPT-4世代で顕著)
赤 = 最も疑わしい 黄 = 高頻度 緑 = 文脈による
日本語のAI頻出表現
| AI的表現 | 人間的な代替 |
|---|---|
| 「多面的な」「多角的な」 | 具体的に何と何の側面かを書く |
| 「〜を浮き彫りにしている」 | データをそのまま提示し、読者に判断を委ねる |
| 「さらに」「加えて」の連続 | 接続詞を省略、または「一方」「ただし」で変化をつける |
| 「〜として位置づけられています」 | 「〜である」「〜だ」と直接書く |
| 「〜が期待されます」 | 誰が何を期待しているか具体的に書く |
| 「〜に寄与する」「〜を促進する」 | 「〜に役立つ」「〜を進める」 |
| 「〜の観点から」「〜の文脈において」 | 不要なら削除。必要なら「〜について言えば」 |
構文パターン — AIの文章構造の癖
三点セット強制(Rule of Threes)
リストが常に3項目。形容詞も3つ並ぶ。AIは何でも三つ組にまとめたがる。
否定的並列構文
「〜ではない。〜なのだ。」形式の多用。レトリックとしては存在するが、AIは頻度が異常に高い。
Emダッシュの過剰使用
英語ではem dash(—)、日本語では全角ダッシュ(——)が不自然に多い。コンマや括弧で十分な場面でも使う。逆に、en dash(–)はほぼ使わない。
→ 括弧で「SGLT2阻害薬(比較的新しい薬剤クラス)は〜」と書く方が自然
要約の強制
短いテキストでも「まとめると」「以上のことから」で締めくくる。繰り返しが不要な場面でも反射的に要約する。
偽の範囲(False Ranges)
「〜から〜まで」と範囲を示すが、実際には関連のない概念を並べているだけ。網羅性を演出する修辞技法。
付足し構文(-ing trailing)
データや事実を述べた後に「〜を浮き彫りにしており」「〜を示唆しています」と意義づけを付加。データ自体に語らせず、解釈を強制する。
→ 「回答者の78%が賛成した。」で十分
過剰なヘッジング
「〜と考えられる」「〜の可能性がある」「〜かもしれない」が連続。断言を避けすぎて、何も言っていない文章になる。
同義語循環
同じ概念を言い換えて繰り返す。語彙の豊富さを見せようとして、実質的に同じことを何度も言う。
フォーマットパターン — 見た目でわかるAIの癖
太字の過剰使用
キーワードを片っ端から太字にする。人間は本当に強調したい箇所だけを太字にするが、AIは「重要そうな単語」を全て太字にする。
インラインヘッダー付き箇条書き
「用語: 説明文」形式の箇条書き。本来は散文で書くべき内容を機械的に分解する。
– 精度: 誤差が低減される
– コスト: 運用費用が削減される
番号リストによる散文の置換
段落で書くべき議論を「1. 2. 3.」の番号リストで処理。ChatGPTの出力に特に顕著。文章の流れが失われ、箇条書きの羅列になる。
絵文字見出し・過度な装飾
見出しやリスト項目に絵文字を多用。「🚀 成長戦略」「🔍 分析手法」のような書式。カジュアルな場面以外では不自然。
トーン・スタイルパターン — AIの「声」の特徴
過剰な宣伝調
「画期的な」「革命的な」「驚くべき」「息を呑むような」を多用。Wikipediaでは中立的な記述が求められるが、AI生成記事はプロモーション文のようになる。
チャットボット残留表現
対話モードの表現がそのまま残る。公開文書やメールで使うと、AI使用が一目瞭然になる。
追従的(Sycophantic)トーン
常に肯定的で、批判的な視点が欠如している。「素晴らしい取り組みです」のような無条件の称賛。人間なら指摘するであろう問題点をスルーする。
過度の象徴化
あらゆるものを「灯台(beacon)」「織物(tapestry)」「礎(cornerstone)」のような比喩で表現。比喩自体が悪いのではなく、頻度と安直さが問題。
意義の過剰強調
すべてが「重要」「画期的」「歴史的」。何でもないことまで大げさに意味づけする。データや事実を淡々と述べる能力が欠如している。
曖昧な出典
「研究によると」「専門家は指摘する」「多くの人が」— 具体的な出典がない。LLMは出典を捏造することもあるため、参照元のない主張は要注意。
実践チェックリスト(16項目)
以下はClaude用スキル「humanizer_academic」「blader/humanizer」をベースに、m0370氏が整理した実用的なチェックリストです。テキストのレビュー時に活用できます。
| # | チェック項目 | 確認ポイント |
|---|---|---|
| 1 | 意義過剰強調 | データの後に「重要性を示している」「浮き彫りにしている」が付いていないか |
| 2 | AI頻出語彙 | delve, pivotal, tapestry, multifaceted等、またはその日本語訳が集中していないか |
| 3 | 付足し構文 | 事実の後に「〜しており」「〜を示唆しています」が連続していないか |
| 4 | 回りくどい繋辞 | 「〜として位置づけられています」を「〜である」で置き換えられないか |
| 5 | 同義語循環 | 同じ概念を違う言葉で何度も繰り返していないか |
| 6 | 三点セット強制 | リストがすべて3項目、形容詞がすべて3つ並びになっていないか |
| 7 | 定型結論 | 「〜が期待されます」「今後の発展が注目されます」で終わっていないか |
| 8 | ダッシュ乱用 | 全角ダッシュ(——)やemダッシュ(—)が不自然に多くないか |
| 9 | 曖昧出典 | 「研究によると」「専門家は」の後に具体的な出典があるか |
| 10 | 過剰ヘッジング | 「〜かもしれない」「〜と考えられる」が3回以上連続していないか |
| 11 | 太字多用 | 本当に強調が必要な箇所だけが太字になっているか |
| 12 | インラインヘッダー箇条書き | 「用語: 説明」形式が連続していないか。散文にできないか |
| 13 | チャットボット残留 | 「もちろんです」「素晴らしい質問ですね」等が残っていないか |
| 14 | 追従的トーン | すべてが肯定的で、批判的な視点がゼロになっていないか |
| 15 | 魂の有無 | 書き手の意見や個性が感じられるか。無菌室的な文章になっていないか |
| 16 | セルフ監査 | 書いた後に「どこがAI生成っぽいか」を自問したか |
AIっぽさを減らすための5つの対策
パターンを知ることは検出だけでなく、AI活用時の文章改善にも役立ちます。AIに下書きを任せた上で、以下の対策を施すことで「AIっぽさ」を大幅に減らせます。
意見を持つ
AIは中立的すぎる。「〜だと考える」「〜は疑問だ」のように自分の立場を明確にする。全方位に配慮した文章は、結局何も言っていない。
リズムを変える
AIの文章は均一なリズム。短い文。長い文。また短い文。意識的に緩急をつける。一語で終わる文を混ぜるだけで印象が変わる。
具体的な経験を入れる
「懸念される」ではなく「深夜3時に勝手にコードを書いているのを見ると落ち着かない」。具体的な感覚や場面の描写はAIが最も苦手とする領域。
冒頭と結論を書き直す
AIの定型パターンが最も出やすいのが冒頭と結論。この2箇所だけでも自分の言葉で書き直すと全体の印象が大きく変わる。
アンチAIパスを実行する
下書き完成後に、上記のチェックリストを使って「AIっぽい箇所」を洗い出し、修正する。このプロセスを最終段階に組み込む。
WikiProject AI Cleanup の取り組み
WikiProject AI Cleanupは、WikipediaにおけるAI生成コンテンツの検出と除去を目的としたボランティアプロジェクトです。2023年後半、フランス語版Wikipediaの編集者Ilyas Lebleuにより立ち上げられました。
主な活動
- AI生成の疑いがある記事の検出・タグ付け・削除(500記事以上をレビュー)
- 「Signs of AI writing」ガイドの作成と維持(24パターンを文書化)
- 迅速削除ポリシーの策定
- AI検出ツール・手法の開発と共有
なぜWikipediaでAI記事が問題なのか
- 一見もっともらしいが、事実誤認(ハルシネーション)を含むことがある
- 存在しない出典が記載されている場合がある(出典の捏造)
- 百科事典としての信頼性と検証可能性を損なう
- 他のWebサイトやAIモデルがWikipediaを引用し、誤情報が連鎖的に拡散する
参考リンク・出典
- Wikipedia: Signs of AI writing — 24パターンの原典
- Wikipedia: WikiProject AI Cleanup — プロジェクト概要
- Wikipedia: WikiProject AI Cleanup Guide — 編集者向けガイド
- AI生成文から「AIくささ」を取り除く技術(Zenn / m0370) — 日本語チェックリストの原典
- How to Spot AI Writing (Beutler Ink) — Wikipedia知見の解説
AI文章の検出は、AIを使わないことではなく、AIを賢く使うこと
チェックリストを活用して、自分の文章をより人間らしく、より説得力のあるものにしましょう。