# import libraries
import numpy as np
import pandas as pd
from tabulate import tabulate
import matplotlib.pyplot as plt 
from ipypublish import nb_setup
from PIL import Image
from IPython.core.display import HTML
table_css = 'table {align:left;display:block} '
HTML('<style>{}</style>'.format(table_css))


## load final confusion matrix from kuzu_main.py for NetLin
## confusion matrix was saved as NumPy array object - file 'conf_matrix.csv'  
# setup pandas for pdf export
pd = nb_setup.setup_pandas(escape_latex=False)

# column names 
japanese = ["o", "ki", "su", "tsu", "na", "ha", "ma", "ya", "re", "wo"] 
class_values = np.arange(0,10)
cols = [japanese, class_values]

# Index label
target_label = 'Target Label:'
# column labels
header = ['Characters:', 'Predicted Label:']

# read saved confusion matrix from NetLin
data1 = pd.read_csv('conf_matrix_netlin.csv', sep=',', names=class_values) 

# assign index names and label
data1.index = pd.Index(class_values, name=target_label) 

# assign column names and labels
data1.columns = cols 
data1.columns = data1.columns.rename(header, level=[0,1])

# display final accuracy result
print("Average loss = 1.0088 \n" +
      "Accuracy = 6961/10000 (70%)")

#display confusion matrix df
data1

Average loss = 1.0088 
Accuracy = 6961/10000 (70%)


## load final confusion matrix from kuzu_main.py for NetFull
## confusion matrix was saved as NumPy array object - file 'conf_matrix.csv'  
# setup pnadas for pdf export
pd = nb_setup.setup_pandas(escape_latex=False)

# column names 
japanese = ["o", "ki", "su", "tsu", "na", "ha", "ma", "ya", "re", "wo"] 
class_values = np.arange(0,10)
cols = [japanese, class_values]

# Index label
target_label = 'Target Label:'
# column labels
header = ['Characters:', 'Predicted Label:']

# read saved confusion matrix from NetFull
data2 = pd.read_csv('conf_matrix_netfull.csv', sep=',', names=class_values) 

# assign index names and label
data2.index = pd.Index(class_values, name=target_label) 

# assign column names and labels
data2.columns = cols 
data2.columns = data2.columns.rename(header, level=[0,1])

# display final accuracy result
print("Average loss = 0.4907 \n" +
      "Accuracy = 8478/10000 (85%)")

#display confusion matrix df
data2

Average loss = 0.4907 
Accuracy = 8478/10000 (85%)


## load final confusion matrix from kuzu_main.py for NetConv
## confusion matrix was saved as NumPy array object - file 'conf_matrix.csv'  
# setup pnadas for pdf export
pd = nb_setup.setup_pandas(escape_latex=False)
# column names 
japanese = ["o", "ki", "su", "tsu", "na", "ha", "ma", "ya", "re", "wo"] 
class_values = np.arange(0,10)
cols = [japanese, class_values]

# Index label
target_label = 'Target Label:'
# column labels
header = ['Characters:', 'Predicted Label:']

# read saved confusion matrix from NetConv
data3 = pd.read_csv('conf_matrix_conv1.csv', sep=',', names=class_values) 

# assign index names and label
data3.index = pd.Index(class_values, name=target_label) 

# assign column names and labels
data3.columns = cols 
data3.columns = data3.columns.rename(header, level=[0,1])

# display final accuracy result
print("Average loss = 0.2587 \n" +
      "Accuracy = 9586/10000 (96%) \n" +
      "Computation time = 20 min, 40 sec")

#display confusion matrix df
data3

Average loss = 0.2587 
Accuracy = 9586/10000 (96%) 
Computation time = 20 min, 40 sec


## load final confusion matrix from kuzu_main.py for NetConv
# Experimented with diff CNN architecture   
## confusion matrix was saved as NumPy array object - file 'conf_matrix.csv'  
# setup pnadas for pdf export
pd = nb_setup.setup_pandas(escape_latex=False)

# column names 
japanese = ["o", "ki", "su", "tsu", "na", "ha", "ma", "ya", "re", "wo"] 
class_values = np.arange(0,10)
cols = [japanese, class_values]

# Index label
target_label = 'Target Label:'
# column labels
header = ['Characters:', 'Predicted Label:']

# read saved confusion matrix from NetConv
data4 = pd.read_csv('conf_matrix_conv2.csv', sep=',', names=class_values) 

# assign index names and label
data4.index = pd.Index(class_values, name=target_label) 

# assign column names and labels
data4.columns = cols 
data4.columns = data4.columns.rename(header, level=[0,1])

# display final accuracy result
print("Optimized NetConv \n" +
      "Average loss = 0.1660 \n" +
      "Accuracy = 9569/10000 (96%) \n" +
      "Computation time = 4 min, 32 sec")

#display confusion matrix df
data4

Optimized NetConv 
Average loss = 0.1660 
Accuracy = 9569/10000 (96%) 
Computation time = 4 min, 32 sec

Characters:	o	ki	su	tsu	na	ha	ma	ya	re	wo
Predicted Label:	0	1	2	3	4	5	6	7	8	9
Target Label:
0	766.0	5.0	8.0	14.0	30.0	64.0	2.0	62.0	31.0	18.0
1	7.0	669.0	106.0	17.0	27.0	22.0	58.0	14.0	26.0	54.0
2	8.0	63.0	689.0	26.0	26.0	21.0	46.0	36.0	47.0	38.0
3	4.0	37.0	58.0	756.0	16.0	57.0	14.0	18.0	28.0	12.0
4	59.0	52.0	84.0	20.0	620.0	20.0	32.0	35.0	20.0	58.0
5	8.0	28.0	124.0	17.0	19.0	727.0	28.0	8.0	33.0	8.0
6	5.0	22.0	146.0	10.0	25.0	24.0	726.0	19.0	8.0	15.0
7	16.0	32.0	29.0	11.0	80.0	15.0	54.0	624.0	91.0	48.0
8	11.0	36.0	96.0	39.0	7.0	31.0	43.0	7.0	709.0	21.0
9	8.0	54.0	86.0	4.0	52.0	30.0	20.0	32.0	39.0	675.0

Characters:	o	ki	su	tsu	na	ha	ma	ya	re	wo
Predicted Label:	0	1	2	3	4	5	6	7	8	9
Target Label:
0	845.0	3.0	2.0	5.0	31.0	32.0	4.0	38.0	35.0	5.0
1	6.0	815.0	37.0	2.0	17.0	12.0	58.0	6.0	18.0	29.0
2	8.0	10.0	844.0	38.0	13.0	16.0	25.0	11.0	19.0	16.0
3	3.0	9.0	31.0	917.0	1.0	16.0	6.0	1.0	7.0	9.0
4	41.0	26.0	22.0	5.0	820.0	5.0	30.0	16.0	20.0	15.0
5	9.0	9.0	86.0	8.0	9.0	827.0	31.0	1.0	14.0	6.0
6	3.0	9.0	52.0	9.0	11.0	4.0	898.0	7.0	2.0	5.0
7	17.0	15.0	22.0	3.0	26.0	7.0	29.0	828.0	22.0	31.0
8	12.0	27.0	29.0	48.0	2.0	7.0	25.0	3.0	840.0	7.0
9	3.0	20.0	49.0	4.0	30.0	7.0	19.0	14.0	10.0	844.0

Characters:	o	ki	su	tsu	na	ha	ma	ya	re	wo
Predicted Label:	0	1	2	3	4	5	6	7	8	9
Target Label:
0	949.0	5.0	3.0	0.0	28.0	4.0	0.0	5.0	4.0	2.0
1	1.0	944.0	8.0	1.0	10.0	0.0	20.0	1.0	7.0	8.0
2	8.0	5.0	934.0	19.0	8.0	7.0	7.0	7.0	2.0	3.0
3	0.0	1.0	12.0	976.0	0.0	5.0	2.0	2.0	2.0	0.0
4	9.0	3.0	3.0	11.0	949.0	6.0	6.0	4.0	7.0	2.0
5	2.0	3.0	21.0	11.0	2.0	948.0	6.0	0.0	4.0	3.0
6	3.0	2.0	13.0	1.0	5.0	2.0	972.0	1.0	0.0	1.0
7	7.0	5.0	5.0	0.0	5.0	0.0	4.0	966.0	6.0	2.0
8	0.0	1.0	3.0	2.0	7.0	2.0	1.0	1.0	983.0	0.0
9	8.0	3.0	3.0	1.0	5.0	1.0	3.0	4.0	7.0	965.0

Characters:	o	ki	su	tsu	na	ha	ma	ya	re	wo
Predicted Label:	0	1	2	3	4	5	6	7	8	9
Target Label:
0	966.0	1.0	3.0	0.0	18.0	1.0	0.0	6.0	4.0	1.0
1	2.0	945.0	3.0	0.0	8.0	2.0	23.0	2.0	9.0	6.0
2	11.0	5.0	912.0	40.0	5.0	7.0	9.0	5.0	4.0	2.0
3	0.0	0.0	16.0	973.0	0.0	5.0	2.0	2.0	1.0	1.0
4	12.0	4.0	1.0	8.0	941.0	2.0	11.0	11.0	7.0	3.0
5	2.0	3.0	22.0	4.0	1.0	954.0	4.0	1.0	5.0	4.0
6	4.0	5.0	9.0	1.0	0.0	3.0	972.0	3.0	1.0	2.0
7	3.0	0.0	5.0	0.0	3.0	1.0	3.0	978.0	3.0	4.0
8	3.0	7.0	4.0	8.0	8.0	2.0	1.0	1.0	965.0	1.0
9	7.0	3.0	5.0	1.0	4.0	0.0	3.0	3.0	11.0	963.0

Character	Misclassified
"o" (0)	"ha" (5)
"ki" (1)	"su" (2)
"su" (2)	"ki" (1)
"tsu" (3)	"su" (2)
"na" (4)	"su" (2)
"ha" (5)	"su" (2)
"ma" (6)	"su" (2)
"ya" (7)	"re" (8)
"re" (8)	"su" (2)
"wo" (9)	"su" (2)

Implementing Neural Networks: Image processing¶

Japanese character recognition¶

Table of Contents¶

Task 1 - NetLin: Linear function followed by log softmax ¶

Task 2 - NetFull: A fully connected 2-layer network ¶

Task 3 - Convolutional neural network ¶

Task 3.1 - CNN: Architecture optimization ¶

Task 4 - Discussion of the confusion matrix for each model ¶

References ¶