بسمه تعالی

یکی از مهم ترین گام ها پس از طراحی یک سیستم مبتنی بر روشهای یادگیری ماشین، ارزیابی خروجی های آن روی مجموعه داده های دیده نشده (hold out) یا آزمایشی (test set) است. مثلا برای ارزیابی روشهای دسته بندی (classification) معمولا مقدار معیارهایی مانند Accuracy و Precision گزارش می شود.

برای ارزیابی دقت (accuracy) روشهای object detection مهم ترین معیار mean Average Precision (mAP) است. این معیار بطور گسترده درمقاله های پژوهشی و مسابقاتی مانند PASCAL VOC،ImageNet و COCO بکار می رود.  اگر گمان می کنید برای محاسبه ی AP می توانید همانند مساله ی دسته بندی چند مرتبه معیار Precision را حساب کنید (مثلا با تغییر مقدار آستانه ی روش) و سپس میانگین بگیرید، بهتر است این مقاله را مطالعه کنید.