AI 生成文から「AI くささ」を取り除く技術 のキャプチャ
AI 生成文から「AI くささ」を取り除く技術 | Zenn
AI 生成文から「AI くささ」を取り除く技術 の関連画像
AI 生成文から「AI くささ」を取り除く技術 | Zenn
GitHub - blader/humanizer のキャプチャ
GitHub - blader/humanizer | GitHub
目次

2026 年 3 月、m0370 氏が Zenn で公開した「AI 生成文から『AI くささ』を取り除く技術と、Claude Code スキルに組み込むまでの話」が注目されている。ChatGPT や Claude に文章を書かせると、どこか「それっぽい」仕上がりになる。丁寧で、整っていて、読みやすい。でも何か引っかかる——その違和感の正体を、Wikipedia のコミュニティが体系的にまとめていることを発見したという。

本稿はこの記事の核心を解説し、AI 生成文から「AI くささ」を取り除く具体的な手法と、日本語文章への適用方法をまとめる。

AI が書いた文章は、なぜバレるのか

Wikipedia の「Signs of AI writing」というページが、AI 生成文の特徴を体系的にまとめている。WikiProject AI Cleanup という有志のプロジェクトが、Wikipedia 上に紛れ込んだ AI 生成記事を何千件も精査するなかで、パターンを抽出してきたものだ。

具体的な観察例:

  • 「pivotal」「landscape」「tapestry」といった単語が 2023 年以降の記事で急増
  • em ダッシュ(—)の使用頻度が LLM 以前と以後で明らかに違う
  • 三点セット(列挙)の強制パターン
  • 過剰なヘッジング(「〜と考えられます」「〜の可能性があります」)

これらのパターンは、LLM が「最もありそうな次の単語」を選び続けた結果として現れる特徴だ。

2 つの Humanizer スキルとの出会い

m0370 氏は GitHub で、Wikipedia の知見を Claude Code のスキルとして実装したプロジェクトを 2 つ発見した。

1. blader/humanizer

blader/humanizer は、Wikipedia の「Signs of AI writing」をほぼ網羅的にカバーした汎用スキルだ。24 個のパターンを検出・修正対象として定義している。

4 つのカテゴリ:

カテゴリ 内容
コンテンツパターン 意義の過剰な強調、三点セットの強制など
言語パターン AI 頻出語彙、回りくどい繋辞など
スタイルパターン 太字の機械的多用、em ダッシュ過剰など
コミュニケーションパターン 追従的トーン、チャットボット残留表現など

それぞれ Before/After の具体例がついていて、すぐに適用できる。

2. matsuikentaro1/humanizer_academic

matsuikentaro1/humanizer_academic は、blader/humanizer をフォーク元として、医学論文向けに特化させたものだ。

例文がすべて EMPA-REG OUTCOME 試験の論文(Circulation 2019)から取られていて、医療系の文章を書く人にとっては実例がそのまま参考になる。

どちらのスキルも、元をたどれば Wikipedia の同じ知見に基づいている。前者は汎用的で「魂のある文章を書く」というセクションまで含んでいて、後者は医学論文の文脈に絞って具体的だ。

日本語の文章に適用するために何が役に立つのか

これらのスキルは英語の文章を対象にしている。そのまま日本語に持ってくるわけにはいかないので、パターンを日本語の文脈に翻訳する作業が必要だ。

英語→日本語のパターン変換例

英語パターン 日本語パターン
Additionally, Furthermore 「さらに」「加えて」の連続使用
serves as, stands as 「〜として位置づけられています」「〜の役割を果たしています」
em dash (—) 過剰 全角ダッシュ(——)の過剰使用
- Bold: Description 「- 速度: コード生成が高速化」のようなインラインヘッダー

m0370 氏は最終的に、以下の16 項目をチェックリストとして整理した。

humanizer_academic から(10 項目)

  1. 意義の過剰な強調 - データ提示後に「これは〜を浮き彫りにしており」のような付け足し
  2. AI 頻出語彙(日本語版) - 「さらに」「加えて」「〜として位置づけられています」
  3. 〜ing 的な付け足し構文 - 「〜を示唆しています」「〜が重要となります」
  4. 回りくどい繋辞(copula 回避) - 「〜です」と書けば済む場面で複雑な構文
  5. 同義語の無意味な循環 - 同じ意味の言葉を言い換えて長さ稼ぎ
  6. 三点セットの強制 - 何でも 3 つで列挙しようとする癖
  7. 定型的な結論パターン - 「今後の展開が注目されます」
  8. ダッシュ類の使用禁止 - em ダッシュ、全角ダッシュの過剰使用
  9. 曖昧な出典への言及 - 「研究によると」「専門家は指摘する」
  10. 過剰なヘッジング - 「〜と考えられます」「〜の可能性があります」

blader/humanizer から追加(6 項目)

  1. 太字の機械的多用 - 箇条書きの先頭を全て太字
  2. インラインヘッダー付き箇条書き - 「- 速度: 説明」形式
  3. チャットボット残留表現 - 「何かお手伝いしましょうか」的な言い回し
  4. 追従的・お世辞的トーン - 「素晴らしい質問です」「ご指摘の通りです」
  5. 魂のある文章を書く - 意見を持て、リズムを崩せ、複雑な感情を認めろ
  6. 執筆後のアンチ AI パス(セルフ監査) - 「この文章のどこが AI 生成っぽいか?」と自問

具体的にどういうパターンを潰すのか

いくつか印象的だったものを紹介する。

「〜ing 的な付け足し構文」

日本語で書いていても頻繁に発生する。

AI っぽい:

HR は 0.65 でした。これは心保護効果の重要性を浮き彫りにしており、今後の治療戦略に大きな示唆を与えています。

人間らしい:

HR は 0.65 でした。

データを提示したあとに「〜を浮き彫りにしており」「〜を示唆しています」と意義づけを付け足すのは、AI の典型的な癖だ。データはデータとしてそのまま置けばいい。読者は自分で意味を読み取れる。

「em ダッシュの使用禁止」

英語圏の AI 生成文では em ダッシュ(—)の頻度が明らかに人間の文章より高いそうだ。日本語でも以下は AI っぽさが出る。

AI っぽい:

SGLT2 阻害薬**——比較的新しい薬剤クラス——**は

人間らしい:

SGLT2 阻害薬(比較的新しい薬剤クラス)は

括弧や読点で代替するだけで印象が変わる。スキルで em ダッシュと全角ダッシュを一切使用禁止にするくらいでもよいかもしれない。

「インラインヘッダー付き箇条書き」

Claude Code の出力で本当によく見る。

AI っぽい:

  • 速度: コード生成が大幅に高速化されました
  • 品質: 出力品質が向上しました

人間らしい:

コード生成が大幅に高速化され、出力品質も向上しました。

人間はこういう書き方をあまりしない。文章として統合するか、太字を外すだけで自然になる。

「魂のある文章を書く」という教え

blader/humanizer で一番面白かったのは、パターンの排除だけでは不十分だと明言しているところだ。AI くさい表現を全部取り除いても、残るのは無菌室のような文章で、それもまた AI っぽいという。

具体的なアドバイス:

  • 意見を持て - 中立的な立場だけでなく、自分の見解を示す
  • リズムを崩せ - 文の長さを一定にしない
  • 複雑な感情を認めろ - 「嬉しいが、同時に不安もある」のような両価性
  • 具体的に感じろ - 抽象的な表現を具体的な感覚に置き換える

例:

AI っぽい:

懸念されます。

人間らしい:

深夜 3 時にエージェントが勝手にコードを書いてるのを想像すると落ち着かない。

後者の方が明らかに人間が書いた感じがする。

執筆後のアンチ AI パス

blader/humanizer の出力プロセスには、興味深いステップが含まれている。下書きを書いたあとに「この文章のどこが AI 生成っぽく見えるか?」と自問し、該当箇所を特定して修正するというものだ。

この「セルフ監査」の発想をスキルに組み込むことができる。記事の下書きが完成したら、冒頭と結論を重点的にチェックする。この 2 箇所は定型パターンに陥りやすく、「ここでは〜について解説します」で始まり「今後の展開が注目されます」で終わる記事は、どう見ても AI が書いたものだ。

スキルへの反映と今後

m0370 氏はこう結ぶ。

正直なところ、チェックリストを入れたからといって AI くささが完全に消えるわけではないと思います。LLM の出力は確率的に「最もありそうな次の単語」を選び続けた結果であって、パターンを潰してもまた別のパターンが出てくるかもしれません。ただ、少なくとも「浮き彫りにしており」「今後の展開が注目されます」のような明らかなシグナルは減らせるはずです。

Wikipedia の Signs of AI writing ページは今も更新され続けている。AI の文体が変われば、検出パターンも変わるだろう。スキルもそれに合わせて更新していく必要がある。

結論:パターンを潰すだけでは不十分

AI 生成文から「AI くささ」を取り除くには、以下の 2 段階のアプローチが必要だ。

第 1 段階:パターン排除

  • 16 項目のチェックリストで明らかな AI パターンを潰す
  • 「浮き彫りにしており」「今後の展開が注目されます」などの定型句を削除
  • em ダッシュ、インラインヘッダー、三点セットなどを避ける

第 2 段階:魂を込める

  • 意見を持つ
  • リズムを崩す(文の長さを変える)
  • 複雑な感情を認める
  • 具体的に感じる表現を使う

パターンを潰すだけでは無菌室のような文章が残る。「魂のある文章を書く」ための具体的なアドバイスを実践することで、初めて人間らしい文章になる。

この記事自体が AI くさくないかどうかは、読者の判断に委ねる。


参考:

引用元・参考リンク

免責事項 — 掲載情報は執筆時点のものです。料金・機能は変更される場合があります。最新情報は各公式サイトをご確認ください。