インターネット計測とデータ解析 (Internet measurement and data analysis)
科目概要
いまや社会基盤となったインターネットの現状や挙動を把握し、
今後を予想することは、技術面のみならず投資判断や政策決定にとっても重要な課題である。
しかし、大規模複雑システムであるインターネットを把握することは難しい。
インターネット全体を網羅する大規模な計測は現実的でない一方で、
従来のサンプリング手法も適用できない場合が多い。 さらに、技術的、
社会的、経済的、法的にも多くの制約があり、その中で問題を解決する必要がある。
本授業は、インターネットの計測技術と大規模データ解析の概要について学び、
情報社会で必須となる大量情報から新たな知識獲得をするための基礎能力を身につける。
授業シラバス
主題と目的/授業の手法など
インターネット計測とデータ解析手法について学習し、
ネットワーク技術と大規模データ処理の総合的な知識と理解を得る。
具体的な応用例について、そこでの問題と制約、その工学的な解決手法を学び、
同時に、その背後にあるネットワーク技術、数学、統計、
アルゴリズムとそれらの関連を理解する。
本授業は、システム系科目と解析系科目を関連づけて統合理解する科目である。
教材・参考文献
講義資料をオンライン配布
提出課題・試験・成績評価の方法など
2回の課題提出と学期末レポート提出
履修上の注意
理論的な理解を深めるためには代数や統計の知識が必要となるが、本授業では、
工学的応用のためにどのように数学が使われるかを理解することに主眼を置く。
授業計画
第1回 イントロダクション (9/29)
ネットワーク計測とインターネット計測
ネットワーク管理ツール
計測ツール
講義資料 (
講義スライド,
参考資料-1,
参考資料-2,
参考資料-3)
第2回 インターネットのサイズを計る (10/6)
ユーザ数、ホスト数
ウェブページ数
精度 誤差 有効数字
講義資料 (講義スライド)
第3回 インターネットの構造を計る (10/13)
インターネットアーキテクチャ
ネットワーク階層
経路制御
トポロジー
グラフ理論
講義資料 (講義スライド)
第4回 インターネットの速度を計る (10/20)
速度計測
利用可能帯域の推測
平均 標準偏差
線形回帰
課題1
講義資料 (講義スライド)
第5回 インターネットの特徴量を計る (10/27)
遅延、パケットロス、ジッタ
フロー計測
相関と多変量解析
グラフによる可視化
講義資料 (講義スライド)
第6回 インターネットの多様性と複雑さを計る (11/10)
ロングテールとさまざまな分布
サンプリング
統計解析
ヒストグラム
期待値と大数の法則
検定と信頼区間
講義資料 (講義スライド)
第7回 インターネットの時間変化を計る (11/17)
インターネットと時刻
時系列解析
課題2
講義資料 (講義スライド)
第8回 インターネットの挙動を計る (12/8)
トラフィック量
経路情報
インターネット計測とプライバシー
講義資料 (講義スライド,
参考資料)
第9回 インターネットの異常や問題を計る (12/11, 12/1休講振替分)
異常検出
スパム判定
ベイズ理論
講義資料 (講義スライド)
第10回 データの記録とログ解析 (12/15)
データフォーマット
ログ解析手法
講義資料 (講義スライド)
第11回 データマイニング (12/22)
パターン抽出
クラス分類
クラスタリング
講義資料 (講義スライド)
第12回 スケールする計測と解析 (1/12)
分散並列処理
クラウド技術
講義資料 (講義スライド)
第13回 まとめ (1/19)
これまでのまとめと今後の展望
WIDEプロジェクトの計測研究
講義資料 (講義スライド)
(参考資料)
$Date: 2014/06/24 01:45:41 $