下巻第1章練習問題

下巻第1章練習問題#

ここでは、 本書の学習内容の定着 を目的とした練習問題を掲載します。解答・解説は「解答例」ページを参照してください。なお、問題の性質上、本書で取り上げた処理と重複することがあります。ご了承ください。

前提#

以下のように、ライブラリのインポートと変数の定義が完了していることを前提とします。

また、以下の関数も利用可能とします。

以下のようにデータを読み込み済みとします。

基礎問題1：アニメ作品別の合計話数#

関連セクション: 棒グラフ

本書では長寿アニメ作品の合計話数を確認しました。ここでは、アニメ作品ごとの合計話数を横棒グラフで可視化してみましょう。

df_aeを用いて、アニメ作品（acname）ごとの合計話数を集計してください
合計話数の 上位10作品 を対象に横棒グラフを作成してください

ヒント

groupby()とnunique()で各話数を集計できます
横棒グラフはpx.bar()でorientation="h"を指定します
本書では上位20作品を対象としていました

基礎問題2：プラットフォーム別のパッケージ数#

関連セクション: 棒グラフ

ゲーム市場では、プラットフォームごとにリリースされるゲームパッケージ数に大きな差があります。どのプラットフォームが最も多くのゲームをリリースしているか確認してみましょう。

df_pkg_pfを用いて、プラットフォーム（pfname）ごとの合計パッケージ数を集計してください
合計パッケージ数の 上位10 プラットフォームを対象に横棒グラフを作成してください

ヒント

groupby()とnunique()でパッケージ数を集計できます
横棒グラフはpx.bar()でorientation="h"を指定します
本書では上位20プラットフォームを対象としていました

標準問題3：ソニー製プラットフォームのパッケージ数#

関連セクション: 棒グラフ

問題2ではプレイステーションシリーズが上位を占めていました。では、ソニー製のプラットフォームに絞って、より詳細に比較してみましょう。

PF2MK辞書を用いて、df_pkg_pfにメーカー名を付与してください
ソニー製のプラットフォームのみに絞り込んでください
プラットフォームごとの合計パッケージ数を横棒グラフで可視化してください

ヒント

.map()メソッドで辞書を使った変換ができます
ブールインデックスでデータを絞り込めます
例: df[df["列名"] == "値"]

標準問題4：2000年代のマンガ作者別合計話数#

関連セクション: 積上げ棒グラフ

本書ではマンガ作者別の合計話数を年代別に可視化しました。ここでは、2000年代（2000〜2009年）に絞って、どの作者が最も多くの話数を持っていたか確認してみましょう。

df_ceに年代情報を付与し、2000年代のデータのみに絞り込んでください
df_cc_crtとマージして、マンガ作者名を取得してください
マンガ作者ごとの合計話数を集計し、上位10名を横棒グラフで可視化してください

ヒント

年はpd.to_datetime()と.dt.yearで取得できます
2000年代は(year >= 2000) & (year < 2010)で絞り込めます
マージにはpd.merge()を使用します

発展問題5：メーカー別ゲームパッケージ数#

関連セクション: 棒グラフ

本書ではプラットフォームごとのパッケージ数を確認しました。では、プラットフォームを「メーカー」という新しい切り口で再集計すると、結果はどう変わるでしょうか？

gm_pkg_pf.csv を読み込み、プラットフォーム名からメーカー名へのマッピング（PF2MK）を適用してください
メーカー別の合計パッケージ数を集計してください
横棒グラフで可視化してください

ヒント

辞書を使った列の変換には .map() メソッドを使用します
横棒グラフは px.bar() で orientation="h" を指定します

発展問題6：アニメシリーズの放送枠#

関連セクション: 積上げ棒グラフ

長寿アニメ作品は、その歴史の中で決まった曜日に放送される「放送枠」を持っていることがあります。この様子を積上げ棒グラフで可視化してみましょう。

an_ae.csv を読み込み、放送曜日を抽出してください
アニメシリーズごとの合計放送日数を「放送曜日（月〜日）」で色分けした積上げ横棒グラフを作成してください
合計放送日数が多い上位10シリーズを対象とし、放送日数の多い順に並べてください

ヒント

放送曜日は .dt.weekday で取得できます（0:月曜日〜6:日曜日）
WEEKDAY2YOBI 辞書で曜日名に変換できます
積上げ棒グラフは px.bar() で barmode="stack" を指定します
category_orders で表示順序を制御できます

発展問題7：ゲーム発売曜日の変遷#

関連セクション: ヒートマップ

ゲーム業界には「新作は〇曜日に出るもの」という商習慣があると言われています。時代とともに「発売曜日の定番」がどのように変化してきたか、ヒートマップで全体像を俯瞰しましょう。

gm_pkg_pf.csv を利用して、発売年と発売曜日を抽出してください
発売年と発売曜日（月〜日）の組み合わせにおけるパッケージ数をヒートマップで可視化してください

ヒント

発売年は .dt.year、発売曜日は .dt.weekday で取得できます
px.density_heatmap() でヒートマップを作成できます
category_orders で曜日の表示順序を制御できます

応用問題8：アニメ放送枠の年代別推移#

関連セクション: ヒートマップ

問題7ではゲームの発売曜日の変遷を確認しました。同様に、アニメの「放送枠」が年代とともにどのように変化してきたか、ヒートマップで俯瞰してみましょう。

ただし、アニメ各話（aeid）の振り方には作品によって違いがあります。例えば、30分枠で2話を放送する場合、1つのaeidでまとめて表現される作品と、2つのaeidで別々に表現される作品があります。そこで、同一日・同一作品の放送を「1枠」として統一的に扱うことにします。

df_aeを用いて、1990年以降のデータに絞り込んでください
放送年と放送曜日を抽出してください
同一日（date）・同一作品（acid）の組み合わせを「1枠」として、放送年×放送曜日ごとの放送枠数を集計してください
ヒートマップで可視化してください

ヒント

1990年以降は year >= 1990 で絞り込めます
放送枠数は date と acid の組み合わせでユニークなものを数えます
drop_duplicates() で重複を除去してから集計する方法もあります
px.density_heatmap() でヒートマップを作成できます

下巻 第1章 練習問題

Contents

下巻 第1章 練習問題#

前提#

基礎 問題1：アニメ作品別の合計話数#

基礎 問題2：プラットフォーム別のパッケージ数#

標準 問題3：ソニー製プラットフォームのパッケージ数#

標準 問題4：2000年代のマンガ作者別合計話数#

発展 問題5：メーカー別ゲームパッケージ数#

発展 問題6：アニメシリーズの放送枠#

発展 問題7：ゲーム発売曜日の変遷#

応用 問題8：アニメ放送枠の年代別推移#

下巻第1章練習問題

下巻第1章練習問題#

基礎問題1：アニメ作品別の合計話数#

基礎問題2：プラットフォーム別のパッケージ数#

標準問題3：ソニー製プラットフォームのパッケージ数#

標準問題4：2000年代のマンガ作者別合計話数#

発展問題5：メーカー別ゲームパッケージ数#

発展問題6：アニメシリーズの放送枠#

発展問題7：ゲーム発売曜日の変遷#

応用問題8：アニメ放送枠の年代別推移#