# HOG SVM & XGBOOST
Obs.: A coluna Ori. representa a origem do dataset. "tcc" significa que os valores foram obtidos durante a execução para obtenção dos dados, "art" representa os dados obtidos no artigo referenciado ao final da página e "norm" representa a execução num dataset normalizado.
Obs.: A execução normalizada foi feita "alinhando por baixo". Isso quer dizer que, para que o mesmo número de amostras (positivas e negativas) fosse executado nos algoritmos, foi escolhido o menor número. Nos datasets atuais, é o número de amostras negativas do PSU (500). Como a divisão treino-teste é 80/20, São usadas 400 amostras de teste e 100 para treino (negativas e positivas, totalizando 1000 amostras).
# INRIA
Treino: 1218 positive, 614 negative
Teste: 435 positive, 288 negative
Ori. | Algoritmo | Acurácia | Precision | Recall | F1 Score | TN-FP-FN-TP |
---|---|---|---|---|---|---|
tcc | Linear SVM | 86,36% | 86,66% | 76,73% | 81,39% | 57% - 5% - 9% - 29% |
norm | Linear SVM | 79,5% | 78,64% | 81% | 79,80% | 39% - 11% - 10% - 40% |
art | Linear SVM | 86% | 92% | 87% | 89% | ?? |
tcc | XGBoost | 87,85% | 94,19% | 73,26% | 82,42% | 59% - 2% - 11% - 28% |
norm | XGBoost | 82% | 80,76% | 84% | 82,35% | 40% - 10% - 8% - 42% |
art | XGBoost | 82% | 94% | 80% | 86% | ?? |
# PSU
- Resolução 960x720:
Treino: 815 positive, 400 negative
Teste: 204 positive, 100 negative
Ori. | Algoritmo | Acurácia | Precision | Recall | F1 Score | TN-FP-FN-TP |
---|---|---|---|---|---|---|
tcc | Linear SVM | 84,21% | 84,82% | 93,13% | 88,78% | 22% - 11% - 5% - 62% |
norm | Linear SVM | 77,5% | 79,56% | 74% | 76% | 41% - 9% - 13% - 37% |
art | Linear SVM | 82% | 64% | 74% | 78% | ?? |
tcc | XGBoost | 80,59% | 79,11% | 96,50% | 86,97% | 15% - 18% - 2% - 64% |
norm | XGBoost | 77,5% | 76,69% | 79% | 77,83% | 38% - 12% - 11% - 39% |
art | XGBoost | 76% | 53% | 68% | 69% | ?? |
- Resolução 256x256:
Treino: 840 positive, 400 negative
Teste: 211 positive, 100 negative
Ori. | Algoritmo | Acurácia | Precision | Recall | F1 Score | TN-FP-FN-TP |
---|---|---|---|---|---|---|
tcc | Linear SVM | 83,55% | 84,07% | 93,13% | 88,37% | 21% - 12% - 5% - 62% |
norm | Linear SVM | 75,5% | 79,31% | 69% | 73,79% | 41% - 9% - 15% - 35% |
art | Linear SVM | 82% | 64% | 74% | 78% | ?? |
tcc | XGBoost | 79,60% | 77,95% | 97,05% | 86,46% | 15% - 18% - 2% - 65% |
norm | XGBoost | 76% | 79,54% | 70% | 74,46% | 41% - 9% - 15% - 35% |
art | XGBoost | 76% | 53% | 68% | 69% | ?? |
Obs.: O artigo original não especifica qual a resolução foi utilizada, logo os dados foram espelhados em ambas as tabelas.
Para o psu, foi realizado um split (a partir de um script para automatizar a tarefa) em 80-20 (treino-teste) randômico. Os dados estão desbalanceados, pendendo mais para amostras positivas (com pedestres)
# Yolov3
Ori. | Dataset | aP |
---|---|---|
Yolo default (coco dataset) | INRIA | 96,18% |
Yolo custom (INRIA) | INRIA | 91,41% |
Yolo default (coco dataset) | PSU | 76,02% |
Yolo custom (PSU) | PSU | 67,62% |
Yolo default (coco dataset) | INRIA & PSU | 79,29% |
Yolo custom (INRIA & PSU) | INRIA & PSU | 66,73% |
# Referências:
R. M. Castelino, G. P. M. Pinheiro, B. J. G. Praciano, G. A. Santos, L. Weichenberger and R. T. D. S. Júnior, "Improving the Accuracy of Pedestrian Detection in Partially Occluded or Obstructed Scenarios," 2020 10th International Conference on Advanced Computer Information Technologies (ACIT), 2020, pp. 834-838, doi: 10.1109/ACIT49673.2020.9208877.
M. Thu, N. Suvonvorn, and M. Karnjanadecha, “A new dataset benchmark for pedestrian detection,” in Proceedings of the 3rd International Conference on Biomedical Signal and Image Processing, 2018, pp. 17–22
N. Dalal, “INRIA Person Dataset,” 2005. [Online]. Available: http://pascal.inrialpes.fr/data/human/.