大学英語教員がAIをどう使っているか — 授業設計・発音評価・フィードバックの裏側

大学英語教員のリアル

大学英語教員がAIをどう使っているか — 授業設計・発音評価・フィードバックの裏側

「AIで授業が変わる」という話はよく聞きます。でも、実際に大学の英語授業でAIを使っている教員が、具体的に何をどうやっているのか。その裏側を、包み隠さず書きます。うまくいっていることも、正直まだダメなことも。

前提:何者が書いているのか

北海道大学で英語の授業を担当しています。専門は第二言語習得(SLA)とメディア研究。それとは別に、自分で英語学習アプリを開発・運用しています。

つまり、「AIについて語る英語教員」ではなく、「AIを自分で作って使っている英語教員」です。この違いは大きい。ツールの便利さだけでなく、裏側の仕組みや限界が見えているからです。

この記事では、実際に授業で運用しているシステムを具体的に紹介します。「こういうことができるらしい」ではなく、「実際にやっている。ここがうまくいって、ここがまだダメ」という話です。

1. 授業設計 — AIは「壁打ち相手」として優秀

シラバスを一から作るのは、毎年やっていてもしんどい作業です。15回分の授業計画、到達目標、評価方法。整合性を取りながら、大学のフォーマットに合わせる。

ここでClaudeを使っています。ゼロから作らせるのではなく、去年のシラバスを渡して「ここを変えたい」「この週の流れが不自然」という相談をする。壁打ち相手です。

これが思った以上に使える。人間の同僚に相談すると「いいんじゃない」で終わることが多いけど、AIは「第8週と第12週で扱う内容が重複している」「到達目標3に対応する評価項目がない」みたいな構造的な指摘をしてくれる。

シラバス設計

前年度のシラバスをClaudeに渡して壁打ち。15回の授業計画の整合性チェック、到達目標と評価方法の対応確認。北大フォーマットに合わせた出力も可能。

多読素材の生成

学生のレベルに合わせた英語テキストをAIで生成。CEFR B1レベルで、授業テーマに関連した内容。語彙制限や文法構造の指定もできる。ただし、ファクトチェックは必須。

TOEFL ITP対策

本番形式の練習問題を生成。リスニングスクリプト、文法問題、リーディング素材。過去問の傾向を学習させた上で作らせると精度が上がる。

正直な話:AIが作った素材をそのまま使うことはありません。必ず自分で読んで、不自然な表現を直し、事実関係を確認します。AIは「たたき台」としては最高だけど、「完成品」として出すには精度が足りない。特に文化的な文脈や微妙なニュアンスは、まだ人間が調整する必要があります。

2. 発音評価 — ここが一番AIの恩恵を受けている

発音評価は、AIが最も実用的に機能している領域です。従来、学生の音読を1人ずつ聞いて評価するのは途方もない作業でした。100人以上の学生が、それぞれ複数回の音読課題を提出する。全部聞くのは物理的に無理です。

現在は、Azure Speech SDK を使った自動評価システムを運用しています。自分で作りました。

実際のパイプライン

学生がNotionで音声を提出してから、評価結果が出るまでの流れはこうです:

1
学生がNotionの課題ページに音声ファイル(.m4a/.mp3)をアップロード
2
Pythonスクリプトが Notion API 経由で音声ファイルを一括ダウンロード
3
Azure Speech SDK で音素レベルの発音評価を実行
4
正確度・流暢さ・完全度のスコアをCSVに出力
5
教員がCSVを確認し、必要に応じて個別フィードバックを追加

Azure Speech SDK が返してくれるもの

単に「発音が良い・悪い」ではありません。Azure Speech SDKは音素(phoneme)単位で評価を返します。

Accuracy Score(正確度)

各音素がネイティブの発音にどれだけ近いか。”th” が “s” になっている、”r” と “l” の区別ができていない、など具体的にわかる。

Fluency Score(流暢さ)

途切れ、言い直し、不自然なポーズの頻度。スムーズに話せているかどうか。

Completeness Score(完全度)

指定されたテキストのどこまで読めているか。飛ばした単語や読み間違いを検出。

Azure と SpeechAce の比較(両方使っている立場から)

大学の授業ではAzure、商用アプリ(SpeakSmart)ではAzureとSpeechAceを併用しています。それぞれ特徴が違います。

Azure Speech SpeechAce
音素評価 詳細(IPA表記付き) 詳細(IELTS準拠スコア)
コスト 従量課金(安い) API呼び出し回数制
プロソディ 基本的なスコアあり リズム・イントネーション評価あり
バッチ処理 自前で実装(Python) APIで1件ずつ
向いている用途 大量一括評価 リアルタイム個別評価

AI発音評価の限界(ここは隠さない)

  • プロソディの評価精度がまだ甘い。イントネーションやリズムの「自然さ」を数値化するのは、音素の正確さを測るよりずっと難しい。「文法的に正しいイントネーション」と「自然に聞こえるイントネーション」は違う。
  • 感情や意図は読み取れない。同じ文でも、皮肉で言っているのか真面目に言っているのかで発音は変わる。AIはそこまで見ない。
  • 非標準的な発音への対応。AzureもSpeechAceも基本的にGeneral Americanが基準。イギリス英語やオーストラリア英語の発音が「間違い」として低スコアになることがある。
  • マイクの品質問題。学生のスマホ録音は品質にばらつきが大きい。ノイズが多いと正確な評価ができない。これはAIの問題というより環境の問題だけど、運用上は無視できない。

3. フィードバック — AIが下書き、教員が仕上げる

学生へのフィードバックは、教員の仕事の中で最も時間がかかる部分の一つです。100人以上の学生に、個別のコメントを返す。しかも意味のあるコメントを。

自分で開発した学習プラットフォームでは、AIがフィードバックの下書きを生成し、教員がそれを確認・編集してから学生に送る仕組みにしています。

ポイントは「AIが書いて教員が確認する」であって、「AIが勝手に送る」ではないこと。最終的に送信ボタンを押すのは教員です。

AIが得意なこと

  • 発音スコアに基づく定型的なアドバイス
  • 文法エラーの具体的な指摘と修正案
  • 学生の成長を前回のスコアと比較して示す
  • 多言語でのフィードバック生成

教員がやること

  • AIの下書きが的外れでないか確認
  • 学生個人の状況に合わせた調整
  • 励ましや動機づけのトーン調整
  • 成績に関わる判断の最終決定

メール通知の仕組み:フィードバックが送信されると、学生にはResend経由でメール通知が届きます。送信元はlanguage-smartlearning.comのドメイン。大学のメールアドレス(hokudai.ac.jp)は外部サービスからの送信に使えないので、Reply-Toに設定して返信だけ大学メールに届くようにしています。こういう地味な技術的制約との戦いが、実は運用の大部分を占めます。

4. TA管理 — 地味だけど効果が大きい

16名のTAを管理しています。面接、評価集計、クラス割付、案内メールの送付。これを年度初めの限られた期間でやる。

ここでのAI活用は派手ではないけど、確実に時間を節約しています。

面接評価の集計

複数の評価項目をスプレッドシートに入力し、AIで総合評価とコメントの要約を生成。面接メモから「この人はこういう強みがある」というサマリーを作る。

クラス割付の最適化

TAの経験、スキル、時間割の都合を考慮した配置案をAIに提案させる。手作業でやると1日かかるパズルが、30分で候補が出る。

案内メールの生成

TAへの各種案内メール(初回案内、シフト連絡、研修案内など)のテンプレートをAIで生成。11種類のテンプレートを用意して、宛先と状況に応じて使い分けている。

5. AIで楽になったこと、面倒になったこと

楽になったこと

  • 発音評価の自動化で、100人分の音読を人力で聞く地獄から解放された
  • フィードバックの下書き生成で、1人あたりの作業時間が半分以下に
  • シラバス設計の壁打ちで、構造的な矛盾を早期に発見できるようになった
  • TA管理の事務作業が大幅に効率化された
  • 多読素材の生成で、学生のレベルに合った教材を柔軟に用意できるようになった

面倒になったこと

  • AIが生成したものを「確認する」作業が新たに発生した。ゼロから作るのとは別の疲れ方をする
  • システムの保守が必要。APIの仕様変更、Notion APIのレート制限、yt-dlpの互換性問題など
  • 学生に「AIが評価している」ことをどう説明するかという新しい課題
  • 「AIがあるから楽でしょ」という周囲の誤解。開発・運用コストは見えにくい
  • 個人情報の取り扱いに、以前より神経を使うようになった

6. AIは「先生の代わり」にはならない

この話は最後にしっかり書いておきたい。

AIは発音を数値化できます。文法エラーを検出できます。フィードバックの下書きを生成できます。でも、それは「教える」こととは違います。

学生が授業中に見せる表情の変化。質問の仕方から透ける理解度。「この学生は今、英語が嫌いになりかけている」という微妙な兆候。こういうものはAIには見えません。

AIが得意なのは、大量のデータを処理して、パターンを見つけて、定型的なフィードバックを生成すること。教員が得意なのは、一人ひとりの学生の文脈を理解して、その瞬間に必要な言葉を選ぶこと。

だから、使い方としては「AIが事務的な部分を肩代わりして、教員は教育的な判断に集中する」というのが現時点での正解だと思っています。AIに教壇に立たせるのではなく、AIに裏方をやってもらう。

まとめ:道具は使い方次第

大学英語教員としてAIを使ってみて思うのは、AIは「魔法の杖」でも「教員不要論の根拠」でもないということです。

発音評価の自動化は確実に授業を変えました。フィードバック生成も時間を節約してくれます。でも、その裏にはシステムの開発・保守があり、AIの出力を検証する手間があり、学生への説明責任があります。

「AIを使えば楽になる」というのは半分正解で半分嘘です。正確に言えば、「AIを使うと、やれることが増える。でも、やるべきことも増える」。

それでも、使わない理由はないと思っています。100人の学生の発音を一人ずつ聞いていた時代には戻れません。大事なのは、AIに任せる部分と人間が握る部分の線引きを、自分の頭で決めること。その判断ができるのは、現場にいる教員だけです。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

上部へスクロール