ゲームデータの前処理

ゲームデータの前処理#

本書の再現に、前処理の再実行は不要

前処理後のデータは全てvizbook-jupyter/data/*以下に格納されています。本書の再現のため、前処理を再実行頂く必要はありません。（仮に再実行したとしても、同じファイルが出力されるだけですので問題はありません。）

準備#

Import#

変数#

関数#

出力先の生成#

`DIR_TMP`への一時的な出力#

zipファイルの解凍#

入力ファイルのサイズ圧縮#

対象#

`gm301`#

`DIR_INTERIM`への中間出力#

`pkg.csv`#

Show code cell content Hide code cell content

# head()メソッドを利用し、df_pkgの先頭5行を表示する
df_pkg.head()

	pkgid	pkgname	publisher	date	price
0	M735723	精彩グラフィック・マージャンカセット・サービス	株式会社コムパック	1982-04-25	3500.0
1	M735295	MP-82用ハード・コピールーチン	株式会社コムパック	1982-05-25	3500.0
2	M735396	グラフィック・カーソル	株式会社コムパック	1982-06-25	3500.0
3	M735265	ALL CAST STAR TREK	株式会社コムパック	1982-07-25	3500.0
4	M735791	夜空のシンフォニー「星系編」（夏の星座）	㈱マイクロ・テクノロジー研究所	1982-08-01	6500.0

`pf.csv`#

Show code cell content Hide code cell content

# `head()`メソッドを用いて、先頭5行を確認
df_pf.head()

	pfid	pfname
0	PF00000	3DO
1	PF00001	64DD
2	PF00002	ClassicMacOS
3	PF00003	MSX
4	PF00004	MSX2

`pkg_pf.csv`#

Show code cell content Hide code cell content

# head()メソッドで先頭5行を確認
df_pkg_pf.head()

	pkgid	pfid
0	M718871	PF00026
1	M718876	PF00028
2	M718877	PF00028
3	M718878	PF00028
4	M718879	PF00000

`DIR_OUTPUT`への最終出力#

`gm_pkg_pf.csv`#

Show code cell content Hide code cell content

# head()メソッドで先頭5行を確認
df_gm.head()

	pkgid	pfid	pkgname	publisher	date	price	pfname
0	M718871	PF00026	くにおくん熱血コレクション 1	アトラス	2005-08-25	5040.0	ゲームボーイアドバンス
1	M718876	PF00028	野々村病院の人々	エ・ル・フ	1996-04-26	6800.0	セガサターン
2	M718877	PF00028	アイドル雀士スーチーパイ Remix	ジャレコ	1995-09-29	6900.0	セガサターン
3	M718878	PF00028	天地無用! 魎皇鬼ごくらくCD-ROM for SEGA SATURN	アローマ	1995-09-29	7800.0	セガサターン
4	M718879	PF00000	Superリアル麻雀 P4 + 相性診断	セタ	1995-03-10	9500.0	3DO

ゲームデータの前処理

Contents

ゲームデータの前処理#

準備#

Import#

変数#

関数#

出力先の生成#

DIR_TMPへの一時的な出力#

zipファイルの解凍#

入力ファイルのサイズ圧縮#

対象#

gm301#

DIR_INTERIMへの中間出力#

pkg.csv#

pf.csv#

pkg_pf.csv#

DIR_OUTPUTへの最終出力#

gm_pkg_pf.csv#

`DIR_TMP`への一時的な出力#

`gm301`#

`DIR_INTERIM`への中間出力#

`pkg.csv`#

`pf.csv`#

`pkg_pf.csv`#

`DIR_OUTPUT`への最終出力#

`gm_pkg_pf.csv`#