pixivに投稿された東方Projectイラストの分析(2022年8月)

概要

pixiv上の東方Projectのイラストについて簡単なデータ分析をしました。

今回は技術系の話はありません。

対象データ

今回対象としたイラストは、アニメーションでない静止画の一枚絵です。複数絵投稿はキャラクターのタグとイラストの対応付けができないため対象外、また、うごイラ作品も今回は対象外としています。
タグの「東方 OR 秘封」で部分一致検索をして、その中で下の画像のタグで完全一致するイラストを集めました。完全一致による選別は東方Project以外の作品(例えば「東方仗助」のイラストなど)を除くためにしています。

完全一致フィルター

データの収集は2021年12月頃から始めたので、それ以前に削除(または非公開)されたイラストなどは取得出来ていません。
データ収集開始してからずっとクローリングして集めてるわけではなく、気が向いたときに収集しているため、短期間で削除された作品は取得出来ていません。
そのため、あくまでも私が収集したイラストの統計であって、投稿された作品全データを正確に表しているわけではないのでご注意下さい。

イラストにつけられたタグから、対応したキャラクターをイラストに割当てます。
対象のキャラクターは、原則的にはゲーム内で登場した自機/中ボス/ボスキャラ、書籍/CDの主要キャラです。
ただし必ずしも厳密でなく、例えば、リリーブラックリリーホワイトと別キャラとして扱っています。私なりに原作を解釈すると同一キャラだとは思いますが、pixiv上のデータとしては別キャラとして扱うのが良いと判断しました。
また、書籍キャラに関しても例えば茨木童子の腕は主要キャラですが対象キャラクターに入れていない(「茨木華扇」タグがイラストが多く、華扇と分離ができないため)、名無しの本読み妖怪は書籍主要キャラでないけど入れているなど、結局は独断で対象を決めています。(一定基準で東方の全キャラを列挙するのは難しいですね…)

キャラクター一覧はこちら(外部リンクです)
ファイルの中のaliasというのはタグの表記揺れに対応するためで、その中で完全一致するタグがあればそのキャラクターと判定します。

タグによりイラストのキャラクターを判別しているため、実際にイラスト内に描かれているキャラクターとは異なることがあります。
キャラクター名のタグが設定されていないイラストや上のファイルのaliasの項にないタグが設定されている場合検出出来ていません。

記事執筆時点(2022年8月31日までのデータ)で、対象のキャラクター数は175、1人以上のキャラクターが検出出来た画像は1864414枚になります。

収集結果

累計データ

キャラ別データ数

全集計結果のうち、イラスト数が多い10キャラクターを見てみます。

東方イラスト数上位10キャラ

キャラクターの画像はAI_Mebiusさんのドット絵を使用しています。(AI_Mebiusさんのホームページ)
今回のデータでは、二人以上描かれたイラストもあるため、割合の合計値は100%を超えます。(例えば霊夢魔理沙がいるイラストの割合は単純に7+6=13%とはならないです。)
結果については、霊夢のイラストが他キャラと差をつけて一番多いですね。(昔どこかでチルノが一番多いって聞いたような気がします。)
魔理沙も主人公らしく2位。他はWin版初期の作品のキャラクターが多いですが、こいしが8位に入り込んでいます。

イラスト一枚あたりのキャラ数、キャラ別単独率

すべてのイラストが1キャラだけ描かれているわけではなく、複数のキャラが描かれたイラストも当然あります。
一枚のイラスト内に何人のキャラクタータグが付けられているか見てみます。

東方イラスト1枚あたりのキャラ数
pixivのタグからキャラクターを検出し、1枚あたりの平均キャラ数

当然というべきか1人のイラストが多いですね。
10人以上のキャラクタータグが付いたイラストは1枚も検出できませんでした。
実際には集合絵など10人以上描かれているイラストは多数ありますが、タグによる分析なのでこういう結果になりました。

全体の平均では、キャラ1人のイラスト(以下単独イラスト)の割合は80%以上ですが、中には誰かとセットで描かれる事が多いキャラもいます。
単独イラストの割合をキャラ別で見てみましょう。

キャラ別単独イラスト率
横軸方向はキャラIDなので意味はありません

横軸はキャラのID(だいたい初登場順)、縦軸はそのキャラの単独イラストの割合です。
細かいところ見ると結構興味深い結果ですが、ここでは上位10キャラと下位10キャラを取り上げます。
まずは、単独イラストの割合が高い上位10人です。

単独イラスト率上位10キャラ

新キャラ(8月31日データ収集時点)の宮出口瑞霊が単独イラスト率1位。新キャラでまだイラスト数は少ないですが、瑞霊よりも数が少ないキャラは他にもいるので、収集期間の問題でイラスト数が少ないだけでなく、まだ他キャラとの絡みが原作であまり描かれていないためですかね。(瑞霊は現時点では公式の色付き媒体で登場していないため、アイコンの配色は今後判明する色とは異なる可能性があります。)
それにしても面白い結果というか、上位のキャラについての傾向が私には全然掴めません。天子などは他キャラとの絡みが多い方だという気がしますがなんで10位に入ってるんだろう…?

反対に単独イラストの割合が低い10人を見てみます。

単独イラスト率下位10キャラ

単独イラスト率最下位は雲山で約11%、2位はふらわ~戦車(里香ではない)で14%でした。
こちらの結果は予想通りという感じがします。雲山は一輪と一緒に描かれることがほとんどでしょうし、他のキャラもそれぞれ誰かとセットで描かれることが多いというのは想像できます。
メリーの単独イラスト割合が約20%なのに蓮子の単独イラスト割合は36%なのはなぜでしょうかね?単純に蓮子の単独イラストがメリーより多いのか、それともメリーのタグを上手く拾えてないんでしょうかね?("マエリベリー・ハーン" OR "メリー" OR "マエリベリーハーン" とタグが一致するイラストを拾っていますが他に代表的な表記があるのかもしれません。)

一緒に描かれるキャラの組み合わせ

先ほどはどのキャラが1人で描かれている事が多いか(少ないか)を調べました。
今度は2人以上で描かれているイラストに注目して、どのキャラの組み合わせが一緒に描かれる事が多いかを調べます。

キャラが2人以上描かれたイラストのうち、他のどのキャラと一緒に描かれているかの割合を算出してみます。
例えば、神子について見てみましょう。

豊聡耳神子の複数キャライラストで一緒に描かれている上位10キャラ
3人以上のキャラ描かれたイラストもあるため合計値は100%を超えます

この例だと、神子を含む2人以上が描かれたイラストのうち、46%のイラストが神子と布都が一緒に描かれています。
合計が100%を超えるのは3人以上描かれたイラストがあるためです。神子布都屠自古の3人組(+α)のイラストが多いのでしょう。

さて、このデータについて全体を見てみます。
ヒートマップで、縦軸が対象キャラ、横軸がそのキャラと一緒に描かれているキャラです(軸の数値はキャラのIDでキャラ一覧の順に割り当てています)。

複数キャライラストで一緒に描かれるキャラのマップ
横軸縦軸はキャラのID

分かりにくい。
対角線付近が目立つので、隣り合うキャラ(例えば5ボスと6ボス)の相関が強そうだということは分かりますが、細かいことが全然分からない。
これ分かりやすく表示したいなあ、という経緯で作ったのが以前の記事です。

seika1212.hatenablog.com

Webページはこちら。
https://kj-apps.onrender.com/th_pixiv_networkkj-apps.onrender.com

データの俯瞰は上ページを見てください。
ここでは先程の神子の例のようにいくつか取り上げます。
折角だからクイズ形式で。次のグラフはどのキャラと一緒に描かれるキャラの割合を表しているでしょう。

複数キャライラストで一緒に描かれている上位10キャラ

上位の顔ぶれを見れば分かりますね。
答えは封獣ぬえと一緒に描かれるキャラです。
1位の小傘でも21%で、神子のときに比べると分散していて中々拮抗していることが分かります。星蓮船(もしくは命蓮寺)組以外にもこいし、フランドール、正邪が入っていますね。 私はぬえ正推しです。

続いてはこちら。次のグラフはどのキャラと一緒に描かれるキャラの割合でしょう。

複数キャライラストで一緒に描かれている上位10キャラ

目立つのは1位チルノが約36%、2位リグルが約23%です。
答えはエタニティラルバと一緒に描かれるキャラです。
妖精や同じ虫であるリグルに混じって天空璋のキャラが入っています。天キャラの中は隠岐奈が一番高く4位です。

では次。次のグラフはどのキャラと一緒に描かれるキャラの割合でしょう。

複数キャライラストで一緒に描かれている上位10キャラ

上位4人が他のキャラと差をつけて高いですね。上から霊夢萃香、青娥、勇儀です。
答えは茨木華扇と一緒に描かれるキャラです。
一番多い霊夢でも約22%でした。もっと多いと思ってたので意外です。

次が最後です。次のグラフはどのキャラと一緒に描かれるキャラの割合でしょう。

複数キャライラストで一緒に描かれている上位10キャラ

魔理沙が他より高く35%強、続いて霊夢が15%弱というのが目立ちます。
答えは森近霖之助と一緒に描かれるキャラです。
名無しの本読み妖怪(朱鷺子)が5位なのが特徴的です。東方香霖堂に登場するキャラがだいたい上位ですね。慧音が4位なのが凄い。

一投稿者あたりの作品数

次の解析では方向を変えて、各投稿者が何枚のイラスト作品を投稿しているか調べます。
今回の集計では複数絵投稿等や過去に削除・非公開されたを作品を含まないため、実際の投稿数とは乖離があります。
まずは1枚以上東方イラストを投稿したユーザの東方イラスト数の分布を表示します。

1枚以上東方イラストを投稿したユーザの東方イラスト数分布
級数は100で一階級の範囲は47.38。

ちょっとわかりにくいかもしれません。一見して1000作品以上投稿してるユーザが数十人は居るということはわかります。すごい。
統計値は平均値が13.3、中央値が3、標準偏差が48.71でした。ちなみに111作品以上投稿していると、東方イラスト数偏差値70以上ということになります。なんか頭良さそう!

範囲を1枚~100枚(以上)にして細かく見てみます。

1枚以上東方イラストを投稿したユーザの東方イラスト作品数分布
級数は100で一階級の範囲は1。右端の階級は100枚以上投稿した人の数。

作品数1ずつで区切っています(1番左は作品数1枚の投稿者が約5万人、2番目は作品数2枚の投稿者が約2万人ということ)。
作品数100枚以上の投稿者は約200人です。

簡単にキャラ別での一投稿者あたりの作品数上位10キャラを見てみます。

一投稿者あたりの平均作品数(キャラ別)上位10キャラ
1作品以上投稿したユーザのみを対象としています。

他より群を抜いて高いのは霖之助です。他のキャラは僅差です。この上位のキャラ達は言い換えれば、沢山そのキャラのイラストを描くファンの割合が高いとも言えます。

R-18イラスト率

pixivに投稿するイラストには閲覧制限を設定します(年齢制限について)。閲覧制限には、制限なし、R-18、R-18Gの3種類があります。
集計したイラストの閲覧制限の割合について見てみます。

pixiv東方イラスト閲覧制限種別

全集計結果のうち、制限なしが94.26%、R-18が5.43%、R-18Gが0.31%となっています。
ただし、今回の集計では複数絵投稿やうごイラを除いているため、多少バイアスがあるとは思います(うごイラはR-18率が高いようです)。
R-18、R-18Gどちらも思ったより高いという印象です。

この中のR-18イラストの割合についてキャラ別で見てみます。

pixiv東方イラストキャラ別R-18率

縦軸は「該当キャライラスト内のR-18率」で、横軸は「東方R-18イラストの内の該当キャラの割合」です(片対数グラフになっています)。
重なって表示されてるキャラについては、申し訳ありませんが姿の一部から推定してください(ブログにアップする際のリサイズで見にくくなってたらすみません)。なお、R-18イラスト0枚のキャラは除外しています。
例えば右上のほうにいる東風谷早苗を説明すると、縦軸方向は約9%で「早苗のイラストのうち約9%がR-18イラスト」となり、横軸方向は約4%で「東方R-18イラストのうち約4%が早苗」ということになります。

R-18率上位の6キャラが目立ちますね。1位から見ていくと、牛崎潤美(10.47%)、茨木華扇(10.23%)、宇佐見菫子(9.78%)、八意永琳(9.32%)、奥野田美宵(9.06%)、東風谷早苗(8.98%)です。
先程の結果で東方イラスト全体のR-18率は5.4%でしたが、全体と比較して多いと感じるか少ないと感じるか人によって別れそうです。

pixiv初期と最近データの比較

作品別イラスト数比較

ピクシブ百科事典のpixivの項によると、pixivは2007年9月10日にサービス開始されました。記事執筆時は2022年なのでだいたい丁度15年前です。

2007年9月は東方Projectの歴史の中では、2007年8月のC72東方風神録が頒布され、書籍では東方儚月抄の連載が始まった頃です。
サービス開始の2007年9月10日から2008年3月10日までの6ヶ月間に投稿されたイラストと、2022年3月1日から2022年8月31日までの最近6ヶ月間に投稿されたイラストについて比較してみます。
2007年9月時点では風神録まで発表されているので、主人公二人及び紅妖永花風の登場キャラのイラスト数の割合を作品別で見てみます。
かなり古い時期のデータを扱いますが、削除・非公開された作品は含まれていませんので、実際に投稿された全作品のデータとは大きく異なる可能性があります。

作品別イラスト数割合変化
上段がpixivサービス開始から6ヶ月間(2007年9月10日~2008年3月10日)に投稿されたイラストのデータ、下段が最近6ヶ月(2022年3月1日~2022年8月31日)に投稿されたイラストのデータ。

全体的な傾向はあまり変わっていないですね。紅魔郷以外。紅魔郷キャラは当時から人気なようですが、最近は更に増大しているようです。

この中の作品ごとの内訳を見て行きます。まずは主人公二人霊夢魔理沙のイラスト数比。

主人公イラスト数割合変化
上段がpixivサービス開始から6ヶ月間(2007年9月10日~2008年3月10日)に投稿されたイラストのデータ、下段が最近6ヶ月(2022年3月1日~2022年8月31日)に投稿されたイラストのデータ。

面白い結果ですね。2007年では魔理沙の方が多い、2022年では霊夢の方が多いという結果です。
いつ頃変わっていったかについては記事の後ろの方で見ます。

次に作品内のキャラクター別稿数割合を見ていきます。
まずは紅魔郷から。

紅魔郷キャライラスト数割合変化
上段がpixivサービス開始から6ヶ月間(2007年9月10日~2008年3月10日)に投稿されたイラストのデータ、下段が最近6ヶ月(2022年3月1日~2022年8月31日)に投稿されたイラストのデータ。

フランドール強い。初期はチルノやレミリア・スカーレットのほうが多かったようですが、最近はフランドールのイラストが多いようです。
他にもルーミアの割合が増えてますね。

次は妖々夢

妖々夢キャライラスト数割合変化
上段がpixivサービス開始から6ヶ月間(2007年9月10日~2008年3月10日)に投稿されたイラストのデータ、下段が最近6ヶ月(2022年3月1日~2022年8月31日)に投稿されたイラストのデータ。
アリスは怪綺談で初登場ですが、ここでは妖々夢キャラとして扱います。

こちらも似た傾向ですね。人気のあった妖夢が更に多くなってるという結果です。
また、細かいところではプリズムリバーの姉妹間格差が小さくなっています。

次は永夜抄

永夜抄キャライラスト数割合変化
上段がpixivサービス開始から6ヶ月間(2007年9月10日~2008年3月10日)に投稿されたイラストのデータ、下段が最近6ヶ月(2022年3月1日~2022年8月31日)に投稿されたイラストのデータ。

こちらは変化は少ないように見えます。リグルやミスティア、妹紅が増えています。

続いて花映塚

花映塚キャライラスト数割合変化
上段がpixivサービス開始から6ヶ月間(2007年9月10日~2008年3月10日)に投稿されたイラストのデータ、下段が最近6ヶ月(2022年3月1日~2022年8月31日)に投稿されたイラストのデータ。
幽香もアリスと同じく、ここでは花映塚キャラとします。

今も昔も文がかなり多いですね。公式出番のほとんど増えていない幽香の割合が増えているというのも面白いです。

最後に風神録です。

風神録キャライラスト数割合変化
上段がpixivサービス開始から6ヶ月間(2007年9月10日~2008年3月10日)に投稿されたイラストのデータ、下段が最近6ヶ月(2022年3月1日~2022年8月31日)に投稿されたイラストのデータ。
文は花映塚のキャラとして扱っているので風神録には含めません。

最近6ヶ月の方では早苗がかなり増えたという感じですね。
風神録は2007年当時は新作だったので、全員同じくらい描かれていたんですかね。

各作品のpixiv初期と最近の比較を見た結果、人気キャラのイラストの割合が更に増大してるという印象があります。

データ推移

先程は初期と最近のデータの前後比較をしましたが、推移データも気になります。

各キャラの割合の推移

東方イラストに占める霊夢魔理沙の投稿イラスト数の割合の変遷を見てみます。
過去30日間の移動平均と累計の2つのグラフを載せます。

主人公イラスト数推移
pixiv東方イラスト数に対するキャラのイラスト数。1枚目は30日間移動平均。2枚目は累計。

縦軸は霊夢魔理沙の割合でなく、全東方イラストに対するキャライラストの割合です。
上のグラフは30日分の移動平均で、30日間に投稿された東方イラストの内の霊夢魔理沙の割合を表しています。2009年頃までは主人公二人の割合は高く、10%程もある時期もあったようです。二人の比較としては、初期は魔理沙の方がやや多いくらいで2010年頃からは霊夢の方が魔理沙より多いようです。最近(2022年8月)ではバレットフィリア達の闇市場が頒布され、魔理沙のイラストが多く投稿されているようです。

下のグラフの方はそれまでの累計を表しています。先程のpixiv初期と最近データの比較では、初期は霊夢より魔理沙のほうが多い、最近では霊夢の方が多いという結果でしたが、推移を見ると2011年頃に逆転したようです。魔理沙の割合が徐々に減っていますが、新作の度にキャラの数は増え続けているので、単純に考えればキャラ別の割合は下がり続けます。むしろ霊夢が割合維持してるのが凄い。

他にも何人か見てみましょう。霊夢魔理沙を見たので、他の代表的な自機キャラ達を見てみます。

准自機キャライラスト数推移
pixiv東方イラスト数に対するキャラのイラスト数。1枚目は30日間移動平均。2枚目は累計。

こちらのグラフも見方はさっきと同じです。
2007年, 2008年頃では早苗の割合が他2人比べて少なかったですが、2009年中頃(地霊殿頒布の頃ですね)から早苗のイラストが一気に増えたようです。2010年,2011年頃から咲夜と早苗が少しづつ割合を下げていますが(上でも書きましたがキャラの数自体が増えているのでキャラ別割合は下がって当然です)、妖夢は減らないどころか少し増えているようにも見えます。近々2009年以来の咲夜と妖夢の逆転が起こりそうです。

次は古明地姉妹を見てみます。

古明地姉妹イラスト数推移
pixiv東方イラスト数に対するキャラのイラスト数。1枚目は30日間移動平均。2枚目は累計。

上のグラフの30日移動平均の方ですが、まず目につくのはこいしに何度かスパイクがありますね。時期を調べてみると毎年5月頃に起きてるようです。なるほど、5月14日はこいしの日というやつですね。
30日間分の平均を取っているのですが、それでもこんなに顕著なスパイクが出るとは。言ってみれば5月に投稿される東方イラストの約10%はこいしです。2015年からは12%まである年もあります。
下の累計グラフの方に着目してみると、登場しばらくはさとりの方が描かれていたようです。こいしは、地霊殿頒布直後よりも、pixiv外の二次創作や心綺楼(2012年5月)での登場などで、イラストが増えていったのだと思われます。

次は別の姉妹について見てみましょう。

スカーレット姉妹イラスト数推移
pixiv東方イラスト数に対するキャラのイラスト数。1枚目は30日間移動平均。2枚目は累計。

東方の二次創作の中でもよく見かけるスカーレット姉妹です。
こちらの姉妹もExtraキャラの妹フランドールがイラスト数を上げ続けて、姉を抜かすという形となっているようです。
フランドールは最近では剛欲異聞での活躍もあり目立つキャラとなっています。姉のレミリアも昔からの人気キャラで、今でも数多くのイラストが投稿されているようです。

全キャラ見てみたいですが、またわかりにくい図になってしまいそうなので、上位のキャラの変遷を動画にしました。
上が移動平均で下が累計です。

再生時間早くしたつもりですが、それでも1本あたり9分あります。再生速度変更出来るはずなので、適宜飛ばしてください。(特に累計の後半はほとんど動き無いです。)

キャラの組み合わせの推移

一緒に描かれるキャラの組み合わせも推移で見てみます。
今回は累計は無しで、100日間の移動平均のグラフだけ載せます。
前と同じく神子から見てみます。

豊聡耳神子の複数キャライラストで一緒に描かれているキャラ割合の推移

数値が高かったキャラから選別して表示しています。
神霊廟頒布直後では布都屠自古が50%以上の神子の複数キャライラストで描かれていました。心綺楼(2013年5月)から原作では白蓮が神子のライバルキャラとして強調され、白蓮とのイラストも布都屠自古に並ぶほどに増えていったようです。レミリアとのイラストも2018年頃急に増えました。鬼形獣(2019年8月)に早鬼が登場し、最近では白蓮と同程度に神子とのイラストが描かれているようです。

ここで出てきた驪駒早鬼と一緒に書かれているイラストの多いキャラを見てみます。

驪駒早鬼の複数キャライラストで一緒に描かれているキャラ割合の推移

圧倒的に八千慧が多いです。70%近くもあるようです。また、剛欲異聞(2021年10月)での尤魔の登場と同時に八千慧の割合も上がっているので、剛欲異聞直後は3人組のイラストが多かったのだと思われます。

最後に古明地こいしと一緒に書かれているイラストの多いキャラを見ます。

古明地こいしの複数キャライラストで一緒に描かれているキャラ割合の推移

一番多いのは姉のさとりです。地霊殿直後では8割近くありましたが、最近では5,6割程度のようです(それでも群を抜いて高いです)。Extraの妹キャラ繋がりでよく一緒にいる二次創作が多いフランドールも、2014年頃からこいしと同じ地霊殿所属の空や燐よりも高くなっているようです。また、心綺楼(2013年5月)でこころが登場し、フランドールと同じか少し高いくらいの割合で、こいしと一緒に描かれているようです。

R-18率推移

最後は、イラストの閲覧制限率の推移です。

pixiv東方イラストR-18率推移

pixiv東方イラストR-18G率推移

上のグラフがR-18率、下のグラフがR-18G率の推移です。R-18率は2020年頃から急に上昇しているように見えますね。R-18Gは0.3%程度で変わっていないようです。
だたし、投稿数を正確に表しているのではなく、取得したイラスト数なので取得前に削除・非公開された作品は計上されていないことをご留意ください。

キャラ別のデータも、霊夢魔理沙だけ載せておきます。

主人公キャライラストR-18率推移 - 100日間移動平均

主人公キャライラストR-18G率推移 - 100日間移動平均

霊夢は全体の傾向と同様2020年以降にR-18作品の割合が高くなっている一方で魔理沙はそこまで顕著な変化はないようです。
R-18G作品でもやはり全体の傾向と同じで大体一定の割合のようです。ただデータ数が少ないため、ブレが大きくなっています。

まとめなど

今回はpixiv上に投稿された東方Projectのイラストのデータについて簡単な統計結果を載せました。
これだけのキャラクター数がいる作品なのでキャラクター別の結果が個性があって面白かったです。個人的には一緒に描かれるキャラクターの解析をネットワークで表現したのが一番楽しかったです。(前記事のことです)
なるべくキャラクターのファンが不快にならないようにネガティブな情報を載せないようにしたつもりでしたが、そうさせてしまった場合は申し訳ありません。
キャラクター別のイラスト数(割合)についての話が多くなってしまいましたが、細かいタグについて見てみると更に面白い結果があったりするので、気が向けばまた別の記事を書くかもしれません。

本記事の統計結果は、pixivに投稿された全データを表現しているものではありません。

本記事の各グラフのキャラクターの画像はAI_Mebiusさんの公開されているドット絵を使用させていただきました。ありがとうございます。(AI_Mebiusさんのホームページ)