TCC | Estudo e Aplicação de Técnicas de Machine Learning

# HOG SVM & XGBOOST

Obs.: A coluna Ori. representa a origem do dataset. "tcc" significa que os valores foram obtidos durante a execução para obtenção dos dados, "art" representa os dados obtidos no artigo referenciado ao final da página e "norm" representa a execução num dataset normalizado.

Obs.: A execução normalizada foi feita "alinhando por baixo". Isso quer dizer que, para que o mesmo número de amostras (positivas e negativas) fosse executado nos algoritmos, foi escolhido o menor número. Nos datasets atuais, é o número de amostras negativas do PSU (500). Como a divisão treino-teste é 80/20, São usadas 400 amostras de teste e 100 para treino (negativas e positivas, totalizando 1000 amostras).

# INRIA

Treino: 1218 positive, 614 negative
Teste: 435 positive, 288 negative

Ori.	Algoritmo	Acurácia	Precision	Recall	F1 Score	TN-FP-FN-TP
tcc	Linear SVM	86,36%	86,66%	76,73%	81,39%	57% - 5% - 9% - 29%
norm	Linear SVM	79,5%	78,64%	81%	79,80%	39% - 11% - 10% - 40%
art	Linear SVM	86%	92%	87%	89%	??
tcc	XGBoost	87,85%	94,19%	73,26%	82,42%	59% - 2% - 11% - 28%
norm	XGBoost	82%	80,76%	84%	82,35%	40% - 10% - 8% - 42%
art	XGBoost	82%	94%	80%	86%	??

# PSU

Resolução 960x720:

Treino: 815 positive, 400 negative
Teste: 204 positive, 100 negative

Ori.	Algoritmo	Acurácia	Precision	Recall	F1 Score	TN-FP-FN-TP
tcc	Linear SVM	84,21%	84,82%	93,13%	88,78%	22% - 11% - 5% - 62%
norm	Linear SVM	77,5%	79,56%	74%	76%	41% - 9% - 13% - 37%
art	Linear SVM	82%	64%	74%	78%	??
tcc	XGBoost	80,59%	79,11%	96,50%	86,97%	15% - 18% - 2% - 64%
norm	XGBoost	77,5%	76,69%	79%	77,83%	38% - 12% - 11% - 39%
art	XGBoost	76%	53%	68%	69%	??

Resolução 256x256:

Treino: 840 positive, 400 negative
Teste: 211 positive, 100 negative

Ori.	Algoritmo	Acurácia	Precision	Recall	F1 Score	TN-FP-FN-TP
tcc	Linear SVM	83,55%	84,07%	93,13%	88,37%	21% - 12% - 5% - 62%
norm	Linear SVM	75,5%	79,31%	69%	73,79%	41% - 9% - 15% - 35%
art	Linear SVM	82%	64%	74%	78%	??
tcc	XGBoost	79,60%	77,95%	97,05%	86,46%	15% - 18% - 2% - 65%
norm	XGBoost	76%	79,54%	70%	74,46%	41% - 9% - 15% - 35%
art	XGBoost	76%	53%	68%	69%	??

Obs.: O artigo original não especifica qual a resolução foi utilizada, logo os dados foram espelhados em ambas as tabelas.

Para o psu, foi realizado um split (a partir de um script para automatizar a tarefa) em 80-20 (treino-teste) randômico. Os dados estão desbalanceados, pendendo mais para amostras positivas (com pedestres)

# Yolov3

Ori.	Dataset	aP
Yolo default (coco dataset)	INRIA	96,18%
Yolo custom (INRIA)	INRIA	91,41%
Yolo default (coco dataset)	PSU	76,02%
Yolo custom (PSU)	PSU	67,62%
Yolo default (coco dataset)	INRIA & PSU	79,29%
Yolo custom (INRIA & PSU)	INRIA & PSU	66,73%

# Referências:

R. M. Castelino, G. P. M. Pinheiro, B. J. G. Praciano, G. A. Santos, L. Weichenberger and R. T. D. S. Júnior, "Improving the Accuracy of Pedestrian Detection in Partially Occluded or Obstructed Scenarios," 2020 10th International Conference on Advanced Computer Information Technologies (ACIT), 2020, pp. 834-838, doi: 10.1109/ACIT49673.2020.9208877.
M. Thu, N. Suvonvorn, and M. Karnjanadecha, “A new dataset benchmark for pedestrian detection,” in Proceedings of the 3rd International Conference on Biomedical Signal and Image Processing, 2018, pp. 17–22
N. Dalal, “INRIA Person Dataset,” 2005. [Online]. Available: http://pascal.inrialpes.fr/data/human/.