pixivに投稿された東方Projectイラストの分析(2022年8月)

  • 概要
  • 対象データ
  • 収集結果
    • 累計データ
      • キャラ別データ数
      • イラスト一枚あたりのキャラ数、キャラ別単独率
      • 一緒に描かれるキャラの組み合わせ
      • 一投稿者あたりの作品数
      • R-18イラスト率
    • pixiv初期と最近データの比較
      • 作品別イラスト数比較
    • データ推移
      • 各キャラの割合の推移
      • キャラの組み合わせの推移
      • R-18率推移
  • まとめなど

概要

pixiv上の東方Projectのイラストについて簡単なデータ分析をしました。

今回は技術系の話はありません。

続きを読む

vis.jsを使ってキャラクターのネットワークを描画する

  • 概要
  • イントロ
  • ネットワーク化するデータ
  • 実装
    • データ
    • jsonファイルを読み込んでネットワーク表示
    • 表示するエッジの重みを指定できるようにする
  • 感想など

概要

vis.jsを使って、pixiv上に投稿された東方Projectのキャラクターがどのキャラクターと一緒に描かれているかをネットワークとして出力するページを作りました。
東方キャラクターネットワーク図

続きを読む

画像を識別をするwebアプリ (Django)

  • 概要
  • イントロ
  • 目標
  • 実装
  • デプロイ

概要

東方Projectのキャラクター画像の識別器のWebアプリをDjangoを使って作成しました。
東方のキャラクター画像識別器

続きを読む

識別器の作成で学んだこと(マルチラベル分類と不均衡データの取り扱い)

  • 概要
  • イントロダクション
  • 手法
    • データ収集
    • 学習
  • 結果 #1
  • 改善手法調査
    • 教師データを整える
    • 損失関数を工夫する
      • 学習係数にデータ数の逆数比をかける(Balanced CE)
      • Class Balanced Loss
      • Focal Loss
  • 結果 #2
    • 改善手法の実験
      • 教師データのサンプリング
      • 損失関数
  • まとめと課題点や感想など

概要

機械学習の勉強として画像の識別器を作成しました。
偏りが大きいデータをどのように扱うかの勉強になりました。

続きを読む