専修大学国際コミュニケーション学部日本語学科

丸山 岳彦 教授

授業について

— まず、丸山先生の担当されている授業について教えていただけますか。
主に「日本語の語彙・意味1・2」「日本語情報処理1・2」「コーパス日本語学1・2」「日本語表現論2」という科目を担当しています。
「日本語の語彙・意味」の授業中の様子です。

「日本語の語彙・意味」では、語彙の体系や語の意味について学びます。「語彙」というのは、語の集合のことです。日本語にはいくつの語があるのか、それはどのような観点からどのように分類できるのか、といったテーマから、実際のテキストで使われている語の種類と数を調査する「語彙調査」まで、幅広く取り上げています。また、意味について言えば、例えば「甘い」という語にはいくつの意味があるでしょうか。「甘いお菓子」「甘い香り」「甘い考え」「甘い声」など、いろいろな例が挙げられますが、すべて同じ意味でしょうか。あるいは、違う意味でしょうか。いろいろな語の意味(語義)を各自で考え、複数の辞書を引き比べながら、グループワーク形式で発表していく授業を展開しています。

「コーパス日本語学」の授業では、言葉の大規模なデータベースである「コーパス」を使った日本語の分析に取り組みます。話し言葉コーパス・書き言葉コーパスを使って日本語の使用実態を客観的に明らかにします。また、コーパスを自分たちで作ってみる体験を通して、コーパスを使うとどのような日本語研究が可能になるのか、考えてもらっています。近年、大学教育の中で「データサイエンス」が重要視されていますが、日本語学の中でもデータサイエンスに最も近い分野が「コーパス日本語学」です。
1年次の「日本語情報処理」では、コンピュータで日本語を処理するための基礎的な知識と技術を学びます。普段みなさんはスマホを使ってSNSでやり取りをしたり、検索をしたりしていると思いますが、その裏で動いているのは日本語情報処理の技術です。先ほどお話ししたコーパスを使った日本語の分析も、日本語情報処理の中で積極的に取り上げています。コンピュータは苦手という学生もいますが、在学中に一通りの技術が身につくよう、指導しています。

ゼミナールについて

— 次に、丸山ゼミの活動内容について教えてください。
「コーパス日本語学」を研究テーマとして、ゼミ活動をしています。日本語の話し言葉・書き言葉を大量に集めた「日本語コーパス」をコンピュータで検索し、集計することで、普段は気づかない言葉の使い方を明らかにしたり、ある言葉とある言葉がどのように使い分けられているかを調べたりすることができます。
— コーパスを使うと、例えば、どんなことが分かるのですか?
話し言葉を大量に集めた「話し言葉コーパス」の分析を例に取りましょう。私たちが話をしていて、言葉に詰まったとき、「えっと」や「あのー」などの形が出てくることがありますね。これらは、「フィラー」と呼ばれます。他にも、「えー」「まぁ」「うーん」など、いろいろな種類のフィラーがあります。普段の日常生活の中で、自分が一番多く使っているフィラーはどれか、分かりますか?
— え、分かりません(笑)。
今、「え」と言いましたよね(笑)。フィラーは、無意識のうち出てくる言葉なので、自分がどのフィラーを多く使っているか、日本語ではどのフィラーが一番多く使われるのか、これは頭で考えても分かりません。そこで、コーパスの出番ということになります。実際の話し言葉を大量に集めた話し言葉コーパスを分析することで、私たちがどのように話しているのかを明らかにしていくことができます。日本語で一番多く使われるフィラーは何か、この問題の正解は、「コーパス日本語学」のページで紹介しています。

また、書き言葉のコーパスを使えば、例えば、いろいろな表記のバリエーションを調べることができます。「たまご、タマゴ、卵、玉子」、「打ち合わせ、打合わせ、打合せ」など、日本語の書き言葉に出てくるさまざまな「ゆれ」を調査できるわけです。どの表記が最も多く使われているか、分かりますか?

さらに、文学作品のテキストを大量に集めてコーパスとして使えば、作家・作品ごとの文体を分析することも可能です。例えば、「青空文庫 」に掲載されている文学作品をコーパスとして用いることで、明治・大正・昭和の文豪たちが日本語をどのように使っていたのか、いろいろな角度から分析することができます。

「青空文庫」を対象に「猫である」を検索した結果です。
図1:「青空文庫」の中から「猫である」という文字列を検索した結果
このほかにも、コーパスの使い道はさまざまです。現在のゼミ生の研究テーマには、「ら抜き言葉の分析」「雑談に現れる相づちの分析」「文字表記のバリエーションの調査」「作家ごとの文体分析」「オノマトペの分析」「流行語の変遷」「日本語学習者による助詞の誤用の分析」「メールに出現する顔文字の意味・機能」などがあります。

研究について

— では、先生のご研究について教えてください。

BCCWJ、CSJの写真です。
ゼミでも取り上げている「コーパス日本語学」を専門領域として、日本語コーパスの設計と開発、そしてコーパスを使った日本語研究を進めています。専修大学に着任するまでは、国立国語研究所 で『日本語話し言葉コーパス 』『現代日本語書き言葉均衡コーパス 』といった日本語コーパスの設計・開発に携わってきました。2020年には、1950年代以降の話し言葉を集めた『昭和話し言葉コーパス 』を開発し、一般公開しました。今から60年も前の話し言葉からは、現代では見られない、興味深い特徴を数多く発見することができます。

コーパスを利用した日本語研究としては、特に、話し言葉に特徴的に出てくるフィラー、言い誤り、言い直し、自己質問、挿入など、非流暢性(disfluency)と呼ばれる現象を話し言葉コーパスから収集し、文法・音声的な側面から分析しています。また、「発話の単位」をどう定義するか、という問題に取り組んでいます。書き言葉には「文」が基本的な単位としてありますが、話し言葉の場合、必ずしも「文」が安定的に取り出せるとは限りません。「発話の単位」をどう定義するかという問題については、海外の研究者たちと連携し、国際的な共同研究ネットワークに参加しています。
2015年夏、ブラジルで開催された国際ワークショップに参加しました。

— コーパスを使った研究の面白さは、どんなところにありますか。
やはり、頭で考えても分からない言葉の使われ方を、コーパスから客観的に明らかにできる、という点だと思います。私たちは普段、特に考えることもなく日本語を話したり書いたりしているわけですが、そこには母語話者でも気づかない傾向や決まりがあるわけです。私たちが日本語を使ってどのように行動しているのか、「話す」「書く」という言語行動の結果そのものを分析して明らかにできるという点が、コーパス日本語学の一番の魅力だと思います。

メッセージ

— 最後に、受験生や在学生にメッセージをお願いします。
大学では、幅広い教養と多角的な視野、そして物事の柔軟な考え方を学んでほしいと思います。それらは、大学を卒業して社会に出ていった後、さまざまな困難に直面したとき、自分自身を導いていくための知恵となるはずです。
日本語学は、母語話者が意識せずに使っている日本語を正面から捉えなおし、客観的に分析する能力を養うのに適した学問分野です。当たり前のことを当たり前と思わず、そこに問題を見つけ、客観的な手続きで課題を解決していく能力を養っていくことは、社会に出て行ったときに必ず役立ちます。自分自身を分析し、前に進んでいくための道筋を見つける力を、専大日語で身につけてほしいと思います。
丸山岳彦

丸山まるやま 岳彦たけひこ(教授)

2000年、神戸市外国語大学大学院外国語学研究科文化交流専攻単位取得退学。ATR音声言語コミュニケーション研究所研究員、国立国語研究所言語資源研究系准教授、オックスフォード大学客員研究員等を経て、2016年に専修大学に着任。博士(学術)。

<リンク>

担当授業  /  研究者情報DB  /  researchmap  /  個人ホームページ
Twitter

トップに戻る