下巻第1章解答例

下巻第1章解答例#

ここでは、 本書の学習内容の定着 を目的とした練習問題とその解答・解説を掲載します。なお、問題の性質上、本書で取り上げた処理と重複することがあります。ご了承ください。

前提#

以下のように、ライブラリのインポートと変数の定義が完了していることを前提とします。

また、以下の関数も利用可能とします。

以下のようにデータを読み込み済みとします。

基礎問題1：アニメ作品別の合計話数#

関連セクション: 棒グラフ

本書では長寿アニメ作品の合計話数を確認しました。ここでは、アニメ作品ごとの合計話数を横棒グラフで可視化してみましょう。

df_aeを用いて、アニメ作品（acname）ごとの合計話数を集計してください
合計話数の 上位10作品 を対象に横棒グラフを作成してください

ヒント

groupby()とnunique()で各話数を集計できます
横棒グラフはpx.bar()でorientation="h"を指定します
本書では上位20作品を対象としていました

解説

groupby()とnunique()を組み合わせることで、各アニメ作品のユニークな話数を集計できます。

横棒グラフは、カテゴリ名が長い場合に特に有効です。アニメ作品名のような日本語の長い名称も、横棒グラフなら見やすく表示できます。

関連セクション: 詳しくは棒グラフを参照してください。

基礎問題2：プラットフォーム別のパッケージ数#

関連セクション: 棒グラフ

ゲーム市場では、プラットフォームごとにリリースされるゲームパッケージ数に大きな差があります。どのプラットフォームが最も多くのゲームをリリースしているか確認してみましょう。

df_pkg_pfを用いて、プラットフォーム（pfname）ごとの合計パッケージ数を集計してください
合計パッケージ数の 上位10 プラットフォームを対象に横棒グラフを作成してください

ヒント

groupby()とnunique()でパッケージ数を集計できます
横棒グラフはpx.bar()でorientation="h"を指定します
本書では上位20プラットフォームを対象としていました

解説

プラットフォームごとのパッケージ数を集計し、横棒グラフで可視化しました。

結果を見ると、プレイステーションシリーズが上位を占めていることがわかります。ソニー[1]のプラットフォームが市場で大きなシェアを持っていたことが読み取れます。

関連セクション: 詳しくは棒グラフを参照してください。

標準問題3：ソニー製プラットフォームのパッケージ数#

関連セクション: 棒グラフ

問題2ではプレイステーションシリーズが上位を占めていました。では、ソニー製のプラットフォームに絞って、より詳細に比較してみましょう。

PF2MK辞書を用いて、df_pkg_pfにメーカー名を付与してください
ソニー製のプラットフォームのみに絞り込んでください
プラットフォームごとの合計パッケージ数を横棒グラフで可視化してください

ヒント

.map()メソッドで辞書を使った変換ができます
ブールインデックスでデータを絞り込めます
例: df[df["列名"] == "値"]

解説

.map()メソッドで辞書を使ってプラットフォーム名からメーカー名に変換し、ブールインデックスでソニー製品のみに絞り込みました。

プレイステーション2が最もパッケージ数が多く、次いでプレイステーション、PSPと続いています。据置機と携帯機の両方でソニーが強力なプラットフォームを持っていたことがわかります。

関連セクション: 詳しくは棒グラフを参照してください。

標準問題4：2000年代のマンガ作者別合計話数#

関連セクション: 積上げ棒グラフ

本書ではマンガ作者別の合計話数を年代別に可視化しました。ここでは、2000年代（2000〜2009年）に絞って、どの作者が最も多くの話数を持っていたか確認してみましょう。

df_ceに年代情報を付与し、2000年代のデータのみに絞り込んでください
df_cc_crtとマージして、マンガ作者名を取得してください
マンガ作者ごとの合計話数を集計し、上位10名を横棒グラフで可視化してください

ヒント

年はpd.to_datetime()と.dt.yearで取得できます
2000年代は(year >= 2000) & (year < 2010)で絞り込めます
マージにはpd.merge()を使用します

解説

日付から年を抽出し、2000年代に絞り込んでからマンガ作者別に集計しました。

2000年代は秋本治（こち亀）や水島新司（ドカベン等）など、長期連載作品を持つ作者が上位に並んでいます。特定の年代に絞ることで、その時代のマンガ業界の傾向を把握できます。

関連セクション: 詳しくは積上げ棒グラフを参照してください。

発展問題5：メーカー別ゲームパッケージ数#

関連セクション: 棒グラフ

本書ではプラットフォームごとのパッケージ数を確認しました。では、プラットフォームを「メーカー」という新しい切り口で再集計すると、結果はどう変わるでしょうか？

gm_pkg_pf.csv を読み込み、プラットフォーム名からメーカー名へのマッピング（PF2MK）を適用してください
メーカー別の合計パッケージ数を集計してください
横棒グラフで可視化してください

ヒント

辞書を使った列の変換には .map() メソッドを使用します
横棒グラフは px.bar() で orientation="h" を指定します

解説

元データから「メーカー」という新しい切り口を定義し、集計するプロセスを体験する問題です。

単一の質的変数の量を比較する際は、横棒グラフを用いると長いカテゴリ名を無理なく配置できます。また、数値順に並べることで、オーディエンスの認知的な負荷を下げることが期待できます。

関連セクション: 詳しくは棒グラフを参照してください。

発展問題6：アニメシリーズの放送枠#

関連セクション: 積上げ棒グラフ

長寿アニメ作品は、その歴史の中で決まった曜日に放送される「放送枠」を持っていることがあります。この様子を積上げ棒グラフで可視化してみましょう。

an_ae.csv を読み込み、放送曜日を抽出してください
アニメシリーズごとの合計放送日数を「放送曜日（月〜日）」で色分けした積上げ横棒グラフを作成してください
合計放送日数が多い上位10シリーズを対象とし、放送日数の多い順に並べてください

ヒント

放送曜日は .dt.weekday で取得できます（0:月曜日〜6:日曜日）
WEEKDAY2YOBI 辞書で曜日名に変換できます
積上げ棒グラフは px.bar() で barmode="stack" を指定します
category_orders で表示順序を制御できます

解説

積上げ棒グラフを用いて、アニメシリーズと放送曜日という二つの質的変数の組み合わせの量を表現する問題です。

『忍たま乱太郎』や『おじゃる丸』のように平日に毎日放送される帯番組と、特定の週末のみに放送される作品では「色の構成」に明確な違いが見られます。ここから、各作品のターゲット層や放送形態を推察できます。

関連セクション: 詳しくは積上げ棒グラフを参照してください。

発展問題7：ゲーム発売曜日の変遷#

関連セクション: ヒートマップ

ゲーム業界には「新作は〇曜日に出るもの」という商習慣があると言われています。時代とともに「発売曜日の定番」がどのように変化してきたか、ヒートマップで全体像を俯瞰しましょう。

gm_pkg_pf.csv を利用して、発売年と発売曜日を抽出してください
発売年と発売曜日（月〜日）の組み合わせにおけるパッケージ数をヒートマップで可視化してください

ヒント

発売年は .dt.year、発売曜日は .dt.weekday で取得できます
px.density_heatmap() でヒートマップを作成できます
category_orders で曜日の表示順序を制御できます

解説

ヒートマップは、2つの質的変数の組み合わせによる「パターンの濃淡」を俯瞰するのに最適です。

このグラフを見ると、日本のゲーム市場における発売曜日の定番が木曜日であることが一目でわかｒます。また、1990年代には金曜日にも一定のボリュームがあったものの、1997年ごろを境に木曜日にシフトした様子も確認できます。

関連セクション: 詳しくはヒートマップを参照してください。

応用問題8：アニメ放送枠の年代別推移#

関連セクション: ヒートマップ

問題7ではゲームの発売曜日の変遷を確認しました。同様に、アニメの「放送枠」が年代とともにどのように変化してきたか、ヒートマップで俯瞰してみましょう。

ただし、アニメ各話（aeid）の振り方には作品によって違いがあります。例えば、30分枠で2話を放送する場合、1つのaeidでまとめて表現される作品と、2つのaeidで別々に表現される作品があります。そこで、同一日・同一作品の放送を「1枠」として統一的に扱うことにします。

df_aeを用いて、1990年以降のデータに絞り込んでください
放送年と放送曜日を抽出してください
同一日（date）・同一作品（acid）の組み合わせを「1枠」として、放送年×放送曜日ごとの放送枠数を集計してください
ヒートマップで可視化してください

ヒント

1990年以降は year >= 1990 で絞り込めます
放送枠数は date と acid の組み合わせでユニークなものを数えます
drop_duplicates() で重複を除去してから集計する方法もあります
px.density_heatmap() でヒートマップを作成できます

解説

drop_duplicates()を用いて、同一日・同一作品の放送を「1枠」として統一的に扱いました。これにより、aeidの振り方の違いによる影響を吸収しています。

ヒートマップを見ると、年代によってアニメ放送枠の分布が変化していることがわかります。特に、2008年の土曜日が目立ちますが、この枠にはどのようなアニメ作品が含まれているのでしょうか？興味のある方は調べてみましょう。

関連セクション: 詳しくはヒートマップを参照してください。

下巻 第1章 解答例

Contents

下巻 第1章 解答例#

前提#

基礎 問題1：アニメ作品別の合計話数#

基礎 問題2：プラットフォーム別のパッケージ数#

標準 問題3：ソニー製プラットフォームのパッケージ数#

標準 問題4：2000年代のマンガ作者別合計話数#

発展 問題5：メーカー別ゲームパッケージ数#

発展 問題6：アニメシリーズの放送枠#

発展 問題7：ゲーム発売曜日の変遷#

応用 問題8：アニメ放送枠の年代別推移#

下巻第1章解答例

下巻第1章解答例#

基礎問題1：アニメ作品別の合計話数#

基礎問題2：プラットフォーム別のパッケージ数#

標準問題3：ソニー製プラットフォームのパッケージ数#

標準問題4：2000年代のマンガ作者別合計話数#

発展問題5：メーカー別ゲームパッケージ数#

発展問題6：アニメシリーズの放送枠#

発展問題7：ゲーム発売曜日の変遷#

応用問題8：アニメ放送枠の年代別推移#