28
2020年度 三回生応用演習 知的高性能計算研究室

2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

2020年度三回生応用演習

知的高性能計算研究室

Page 2: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

応用演習スケジュール

日付 内容 ツール・言語 講師

11/23(月) 顔合わせ、画像処理の基本、データ処理基礎

Anaconda、Python、OpenCV

孟、

横尾、

田中、

渥美、

11/30(月) IoTエッジデバイスの使用1. LED制御2. カメラ起動、画像から、顔の抽出など

Raspberry PiPython、OpenCV

12/7(月) IoTサーバー側の使用1. Edgeからサーバーへデータ転送2. 音声の分析、照合な

SQL、Python

12/14(月) 機械学習:SVM,NN, Python,PyTorch

1/21(月) 深層学習:画像分類 Python,PyTorch

1/9(土) FGPAハードウェアデザイン VIVAD、Verilog-HDL

1/18(月) 報告:PPT作成指導、プレゼンテーション練習

Page 3: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

第一回画像処理の基礎

11/23

知的高性能計算研究室

Page 4: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

4

PILにおけるImage関数を利用

画像の読込みと書込み

OpenCVを利用

読み込み

書き込み

読み込み

書き込み

Page 5: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

画像リサイズ

画像サイズを(1500,1000)の固定値とする(PIL)

画像サイズを0.3倍に縮小(Opencv) RGB

5

Page 6: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

画像の回転

回転画像90度(PIL)

回転画像90度(OpenCV)図1 原図

図2 回転画像

方向

6

Page 7: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

グレースケール変換

PIL

OpenCV図1 原図

図2 グレースケール画像

7

Page 8: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

二値化画像に変換

二値化画像(PIL)

二値化画像(Opencv)

図1 原図

図2 二値化画像

グレースケール化

グレースケール化

8

Page 9: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

画像のピクセル計算

図1 プログラム実行結果

図2ピクセル計算(X軸)

二値化

hor: X軸ver: Y軸

9

Page 10: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

バッチ処理(PIL)

10

図1 フォルダ構造

図2 プログラム実行結果

フォルダが存在しない場合はフォルダを作成

画像処理

指定されたフォルダに含まれるフォルダ名のリス

トを返す

Page 11: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA
Page 12: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

画像処理と深層学習を用いたくずし字認識

知的高性能計算研究室

呂氷 (ロビン )

Page 13: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

13

• 研究背景・目的• 提案システム前処理テキスト検出テキスト切り取り文字認識

• 実験条件• 実験結果• まとめと今後の課題

目次

Page 14: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

研究背景• 研究者らは深層学習を用いて、くずし文章の自

動認識を目指しているが、難航している• くずし文字のバリエーションが多い• 文字同士のつながり• 文章と絵が混在

14

Page 15: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

研究目的

• 画像処理と深層学習を用いて、日本古典籍の画像に対して、文章領域の抽出から文字認識までの自動化を目指し、日本古典籍の解読整理と保護に貢献

15

提案した文字認識システムの流れ

前処理ARU-Netでテキスト検出

テキスト切り取り

AlexNetで文字認識

Page 16: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

前処理(1/2):枠除去

16

画像二値化

ピクセル計算

ピーク発見

枠座標推定

画像カット

原図

枠を除去した画像

最大ピーク発見

枠除去

二値化

Page 17: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

前処理(2/2):余白除去

17

画像二値化

ピクセル計算

平均値計算

平均値を超えた最初と最後の座標で余白

推定

画像カット

原図

余白を除去した画像

平均値1877

平均値2957

余白除去

Page 18: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

テキスト検出(1/2)

18

• ARU-Netは、歴史的文書の文章行を検出す

るために使用した深層学習モデル

0.5 倍

0.3 倍

Page 19: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

テキスト検出(2/2)

19

• 同じ画像をARU-Netで2回処理

180度回転

ARU-Netでテキスト検出

図3 テキスト検出結果

図1

図2

Page 20: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

20

テキスト切り取り• 赤い線と青い線間のテキストを切り取る• 上から画像の横の1/5を経て切り出す(正方形)

ARU-Netで検出結果 文字を切り取り

Page 21: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

21

文字認識 (AlexNet)• 切り出した画像を文字認識• 認識率が最も高い認識結果を選択(赤い長方形)

雨90.2% 而8.8% 両1.0%

雨50.4% 両30.2% 四19.4%

四46.2% 目37.5% 日16.3%

月90.5% 目9.0% 口0.5%

月100% 目0.0% 日0.0%

文字認識例

Page 22: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

実験条件• データベース:

• 人文学オープンデータ共同利用センター(http://codh.rois.ac.jp/)の「浮世風呂」(「うきよぶろ」番号:200015779) (文字種:1817 文字数:60381)

• 実験環境:• OS:ubuntu16.04 LTS• プログラミング言語:Python

22文字種と文字数(一部) トレーニング画像例

Page 23: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

• トレーニングデータが不足しているため、データセットを増加• 1枚のトレーニング画像の文字を上、下、左、右計4方向に、それぞれ25と50ピクセル移動

(原図 + 4方向*2パターン = 9枚に拡張)

23

原図 右へ 左へ 上へ 下へ

文字移動例(25ピクセル)

トレーニング画像拡張

Page 24: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

• 認識率が一番高い結果から、認識率が90%以上

の結果のみを選出(赤いと青い長方形)• 一部の文字は正しく認識できたが、一部は正しく

認識できなかった

24

実験結果

一番高い認識率

文字認識結果

Page 25: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

まとめと今後の課題

• ARU-NetとAlexNetに基づく文字認識システムを構築

• より高い精度を達成するために、枠除去と余白除去の手法を提案

• 今後の課題• 注釈文字の認識(右の図の赤い枠部分)

• 画像処理で文字認識率を向上させる

25

Page 26: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA
Page 27: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

メールの書き方**様(さん、様、先生)いつもお世話になっております。お疲れ様です。要件。。。。。

***送信者

だれから、だれに送ることを明記する。メールを常にチェックすること、ちゃんと返事すること

Page 28: 2020年度 三回生応用演習 - 立命館大学...SQL 、 Python 12/14(月) 機械学習: SVM,NN, Python, PyTorch 1/21(月) 深層学習: 画像分類 Python, PyTorch 1/9(土) FGPA

雑談と感想

•研究室の役割•勉強する場所•友達作る場所•グループ研究・チームワーク

•進路•条件を揃えば、院進して