統計的手法の研究と応用[担当:宇佐美 嘉弘]
| ゼミナール名称 | 統計的手法の研究と応用 |
| 研究テーマ | 社会で役に立つデータ分析力を身に付ける |
| ゼミナール所属 | 経営学部 |
| 学修内容 | 経営学部では1年生の必修科目に「統計入門」があります。そこでは全体(「母集団」)から一部分(「標本」)を取り出して(「標本抽出」)、母集団の特徴を標本に基づいて分析する方法(「統計的推測」)の基礎を学びます。ゼミナールの3年生ではまず「統計入門」で学んだ内容を確認しながら、「統計検定(一般財団法人統計質保証推進協会が商標権を保有する登録商標)」の2級に合格する力を身に付けます。検定を受験するかどうかは学生に任せています。過去の合格者の中には、「就職活動で、採用担当者から自分は文科系でも数字に強いと思ってもらえた」という卒業生がいました。
推測統計の学修がある程度進んだ段階で、より実践的な内容に取り組んでいきます。多変量解析、時系列解析、テキストマイニング、機械学習など発展的な手法を扱ういくつかのテキストの中から、学生の希望を聞いて使用するものを決めています。理解を深められるよう、RやPythonのソースコードが掲載されているテキストを選び、それらを実行しながら読み進めます。一冊のテキストをしっかりと読み、その内容を確実に身に付けることを目指します。これにより、問題の設定、データの収集と整形、モデルの構築、結果の解釈といった一連のプロセスを経験することになります。こうした実践を通して、分析の流れを総合的に理解し、実際のデータに対する応用できる力を養っていきます。 4年生では、学生それぞれが興味のあるテーマを選び、卒業論文の作成に取り組みます。研究では、扱いたいデータや分析方法を自分で検討し、試行錯誤しながらまとめていきます。すぐにテーマが決まるとは限りません。データの入手が難しい場合もあります。良い結果が得られないかもしれません。それまでに学んだ経験が、ここで活かされます。そして、自分で深めていく楽しさや達成感を味わいながら、4年間の集大成として論文を完成させていきます。 |
| ゼミ生の人数 | 例年、各学年1人か2人が所属しています。 |
| 開講日時など | 水曜日2時限からお昼休みにかけて |
| 卒業論文・卒業研究 | 卒業年次生には卒業論文を提出します。 |
| サブゼミナール | サブゼミはありません。ゼミナールの正規の時間は延長しますが、別に時間をとることはしていません。4月から3年生となる新ゼミ生とは春休みに「統計検定」の勉強会をオンラインで行っています。 |
| ゼミナール合宿 | 所属する学生が少数なので、合宿は行っていません。 |
| 対外活動など |
取り組みはありません。データ分析のコンテストへの参加を希望する学生がいれば、参加したいと考えています。 |
| OB・OGの進路 | 就職先が決まったかどうかは確認します。業界を尋ねたことはあります。しかし、具体的な企業名などを質問をしたことはありません。 |
| OB・OG会 | ありません。 |
| 教員紹介 | ある変数Xを使って、別の変数Yがどう変わるのかを調べたいとします。しかし、Yの変化がすべてXだけで説明できるわけではありません。Xでは説明できない残りの部分があり、これを「誤差」と呼びます。
この誤差を正しく理解することが大切です。誤差をきちんと見ることができると、XとYの関係を正しくつかめるようになります。誤差がどのようなルール(分布)に従っているのか、誤差どうしに関係(相関)があるのかが分かると、XとYの関係をより正確に推測できるようになります。 つまり、XとYの関係を正しく知るためには、こうした誤差の性質を理解することがとても大切なのです。 私が興味を持っているのは、変数Xを使ってYを説明するとき、その関係が直線で表せる場合です。これを「線形回帰モデル」と呼びます。このとき、誤差どうしの相関をうまく捉えることで、直線の切片や傾きといったパラメータの推定を、より正確にできるようにしたいと考えています。 ここで直線というのは「Xが決まったときのYの平均」を意味します。しかし、実際にYを観測すると、その平均どおりになるとは限りません。平均からズレが生じ、そのズレが誤差です。 もし誤差そのものを直接観測できれば、観測されたYから誤差を取り除いて直線だけを取り出すことができます。しかし実際には、誤差そのものを直接見ることはできません。 そこで、まずは誤差に関する情報がないため、「誤差どうしに特別な関係はなく、ばらつきの大きさも同じ」というシンプルな仮定を置いて直線を推定します。これによってXに対するYの平均の仮の推定値が求まります。そして、観測されたYからその平均の推定値を引いたものを「残差」と呼びます。残差は、観測できない誤差の代わりとなる誤差の推定値です。 この残差を調べることで、誤差がどのような分布をしているか、誤差どうしに相関があるかといった性質を推測できます。こうした情報を利用してもう一度XとYの関係(直線)を推定し直すと、最初の推定よりも精度の高い推定ができるようになります。 私は、このように誤差の性質を手がかりにして、モデルの推定を改善していく方法に興味があります。 宇佐美 嘉弘[専修大学研究者情報システム] |
[2026年3月掲載]