密度プロット

密度プロット#

準備#

Import#

変数#

関数#

Show code cell content Hide code cell content

def create_distplot(
    df: pd.DataFrame,
    x: str,
    color: str = None,
    show_hist: bool = False,
    show_rug: bool = False,
    **kwargs: Any
) -> Figure:
    """
    データフレームから密度プロットとヒストグラムを作成する

    Parameters
    ----------
    df : pd.DataFrame
        プロットするデータを含むデータフレーム
    x : str
        密度プロットの描画対象とするカラム名
    color : str, optional
        データを分割する基準とするカラム名、指定しない場合はx列の全データを用いる
    show_hist : bool, optional
        ヒストグラムを表示するか否か、デフォルトはFalse
    show_rug : bool, optional
        ラグプロットを表示するか否か、デフォルトはFalse
    **kwargs
        ff.create_distplotに渡すその他のキーワード引数

    Returns
    -------
    Figure
        作成されたプロットのFigureオブジェクト
    """

    if color:
        # colorカラムの値でデータをグループ分け
        grouped = df.groupby(color)

        # 各グループのxカラムのデータをリストに格納、可視化用に逆順に並び替え
        hist_data = [group[x].values for _, group in grouped][::-1]

        # 各グループの名前（colorカラムの値）をラベルとしてリストに格納、可視化用に逆順に並び替え
        labels = [str(name) for name, _ in grouped][::-1]

        # 密度プロットとヒストグラムを作成
        fig = ff.create_distplot(
            hist_data, labels, show_hist=show_hist, show_rug=show_rug, **kwargs
        )
    else:
        # colorが指定されていない場合はx列の全データを用いる
        hist_data = [df[x].values]

        # 密度プロットを作成（ラベルはxを指定）
        fig = ff.create_distplot(
            hist_data,
            group_labels=[x],
            show_hist=show_hist,
            show_rug=show_rug,
            **kwargs
        )

    # x軸のタイトルをxに変更
    fig.update_xaxes(title=x)

    # y軸のタイトルを"確率密度"に変更
    fig.update_yaxes(title="確率密度")

    # 作成されたプロットを返す
    return fig

可視化例#

マンガデータ#

Show code cell content Hide code cell content

# 可視化対象のDataFrameを確認
df_cm.head()

	マンガ雑誌名	一話あたりのページ数	掲載日	マンガ作品名	各話ID
0	週刊少年マガジン	22.0	2011-05-25	ダイヤのA	CE00000
1	週刊少年マガジン	18.0	2011-05-25	君のいる町	CE00001
2	週刊少年マガジン	18.0	2011-05-25	アゲイン!!	CE00002
3	週刊少年マガジン	20.0	2011-05-25	FAIRY TAIL	CE00003
4	週刊少年マガジン	20.0	2011-05-25	A-BOUT!	CE00004

アニメデータ#

Show code cell content Hide code cell content

# 可視化対象のDataFrameを可視化
df_an.head()

	アニメ作品ID	アニメ作品名	アニメ作品の合計話数
0	C10001	ギャラクシーエンジェル	24
1	C10003	PROJECT ARMS	26
2	C10005	探偵少年カゲマン	6
3	C10006	Mr.Digital TOKORO the comical cartoon ［第1期］	120
4	C10008	GEAR戦士[ギアファイター] 電童	38

Show code cell content Hide code cell content

# 可視化対象のDataFrameを確認
df_an2.head()

	アニメ作品ID	アニメ作品名	放送曜日	アニメ作品の合計話数
0	C9082	忍たま乱太郎第2期	月	24
1	C13639	俺たちに翼はない --under the innocent sky.	月	12
2	C10978	がくえんゆーとぴあまなびストレート!	月	12
3	C16032	ポンコツクエスト -魔王と派遣の魔物たち- [第3期]	月	12
4	C9348	花より男子	月	1

ゲームデータ#

Show code cell content Hide code cell content

# 可視化対象のDataFrameを確認
df_gm.head()

	プラットフォーム名	パッケージ名	ゲームパッケージの価格
0	ゲームボーイアドバンス	くにおくん熱血コレクション 1	5040.0
1	セガサターン	野々村病院の人々	6800.0
2	セガサターン	アイドル雀士スーチーパイ Remix	6900.0
3	セガサターン	天地無用! 魎皇鬼ごくらくCD-ROM for SEGA SATURN	7800.0
4	3DO	Superリアル麻雀 P4 + 相性診断	9500.0

Show code cell content Hide code cell content

# 可視化対象のDataFrameを確認
df_gm2.head()

	プラットフォーム名	パッケージ名	ゲームパッケージの価格
0	プレイステーション2	THE MATRIX: PATH of NEO	6700.0
1	プレイステーション2	デフジャム・ファイト・フォー・NY EA BEST HITS	3129.0
2	プレイステーション2	てのひらを、たいように～永久の絆～	7140.0
3	プレイステーション2	デッドトゥライツ	7140.0
4	プレイステーション2	デストロイオールヒューマンズ! THQ Collection	3129.0

密度プロット

Contents

密度プロット#

準備#

Import#

変数#

関数#

可視化例#

マンガデータ#

アニメデータ#

ゲームデータ#