اگر آپ نے کبھی اپنے فون کو اپنے چہرے سے غیر مقفل کیا ہے، رسید کو اسکین کیا ہے، یا خود چیک آؤٹ کیمرہ کو گھورتے ہوئے سوچا ہے کہ آیا یہ آپ کے ایوکاڈو کا اندازہ لگا رہا ہے، تو آپ کمپیوٹر ویژن کے خلاف برش کر چکے ہیں۔ سیدھے الفاظ میں، AI میں کمپیوٹر وژن یہ ہے کہ مشینیں فیصلے کرنے کے لیے تصاویر اور ویڈیو کو اچھی طرح دیکھنا اور سمجھنا مفید؟ بالکل۔ کبھی کبھی حیران کن؟ اس کے علاوہ ہاں۔ اور کبھی کبھار تھوڑا سا ڈراونا اگر ہم ایماندار ہیں۔ بہترین طور پر، یہ گندے پکسلز کو عملی کاموں میں بدل دیتا ہے۔ اس کی بدترین حالت میں، یہ اندازہ لگاتا ہے اور ڈوب جاتا ہے۔ آئیے صحیح طریقے سے کھودیں۔
اس کے بعد آپ جو مضامین پڑھنا پسند کر سکتے ہیں:
🔗 AI تعصب کیا ہے
AI سسٹمز میں تعصب کیسے بنتا ہے اور اس کا پتہ لگانے اور اسے کم کرنے کے طریقے۔
🔗 پیشن گوئی AI کیا ہے
پیشین گوئی کرنے والا AI رجحانات اور نتائج کا اندازہ لگانے کے لیے ڈیٹا کا استعمال کیسے کرتا ہے۔
🔗 AI ٹرینر کیا ہے
ذمہ داریاں، مہارتیں اور ٹولز جو AI کو تربیت دینے والے پیشہ ور افراد استعمال کرتے ہیں۔
🔗
ماڈلز کی تعمیر اور تعیناتی کے لیے گوگل کے متحد AI پلیٹ فارم کا گوگل ورٹیکس AI جائزہ کیا ہے
AI میں کمپیوٹر وژن کیا ہے، بالکل؟ 📸
AI میں کمپیوٹر ویژن مصنوعی ذہانت کی وہ شاخ ہے جو کمپیوٹر کو بصری ڈیٹا کی تشریح اور استدلال کرنا سکھاتی ہے۔ یہ خام پکسلز سے لے کر ساختی معنی تک پائپ لائن ہے: "یہ ایک رکنے کا نشان ہے،" "وہ پیدل چلنے والے ہیں،" "ویلڈ خراب ہے،" "انوائس کی کل رقم یہاں ہے۔" اس میں درجہ بندی، پتہ لگانے، سیگمنٹیشن، ٹریکنگ، گہرائی کا تخمینہ، OCR، اور پیٹرن لرننگ ماڈلز کے ذریعے مزید سلائی جیسے کاموں کا احاطہ کیا گیا ہے۔ رسمی فیلڈ کلاسک جیومیٹری سے لے کر جدید گہری تعلیم تک پھیلا ہوا ہے، عملی پلے بکس کے ساتھ آپ کاپی اور موافقت کر سکتے ہیں۔ [1]
فوری کہانی: ایک معمولی 720p کیمرے کے ساتھ ایک پیکیجنگ لائن کا تصور کریں۔ ایک ہلکا پھلکا ڈیٹیکٹر اسپاٹ کیپس، اور ایک سادہ ٹریکر تصدیق کرتا ہے کہ وہ بوتل کو سبز روشنی دینے سے پہلے لگاتار پانچ فریموں کے لیے منسلک ہیں۔ فینسی نہیں - لیکن سستا، تیز، اور یہ دوبارہ کام کو کم کرتا ہے۔
AI میں کمپیوٹر وژن کو کیا کارآمد بناتا ہے؟ ✅
-
سگنل ٹو ایکشن فلو : بصری ان پٹ ایک قابل عمل آؤٹ پٹ بن جاتا ہے۔ کم ڈیش بورڈ، زیادہ فیصلہ۔
-
جنرلائزیشن : صحیح ڈیٹا کے ساتھ، ایک ماڈل مختلف قسم کی تصاویر کو ہینڈل کرتا ہے۔ بالکل نہیں - کبھی کبھی چونکا دینے والی اچھی طرح سے۔
-
ڈیٹا لیوریج : کیمرے سستے اور ہر جگہ ہیں۔ بصیرت پکسلز کے اس سمندر کو بصیرت میں بدل دیتی ہے۔
-
رفتار : ماڈلز ٹاسک اور ریزولوشن کے لحاظ سے معمولی ہارڈ ویئر یا قریب حقیقی وقت میں فریموں پر کارروائی کر سکتے ہیں۔
-
کمپوزیبلٹی : قابل اعتماد نظاموں میں آسان اقدامات کا سلسلہ: پتہ لگانا → ٹریکنگ → کوالٹی کنٹرول۔
-
ایکو سسٹم : ٹولز، پہلے سے تربیت یافتہ ماڈل، بینچ مارکس، اور کمیونٹی سپورٹ- کوڈ کا ایک وسیع بازار۔
آئیے ایماندار بنیں، خفیہ چٹنی کوئی راز نہیں ہے: اچھا ڈیٹا، نظم و ضبط کا جائزہ، محتاط تعیناتی۔ باقی مشق ہے ... اور شاید کافی۔ ☕
AI میں کمپیوٹر وژن کیسے کام کرتا ہے، ایک سمجھدار پائپ لائن میں 🧪
-
تصویری حصول
کیمرے، سکینر، ڈرون، فون۔ سینسر کی قسم، نمائش، لینس، اور فریم کی شرح کو احتیاط سے منتخب کریں۔ کوڑا کرکٹ وغیرہ -
پری پروسیسنگ
کا سائز تبدیل کرنا، کاٹنا، نارملائز کرنا، اگر ضرورت ہو تو ڈیبلر یا ڈینوائز کرنا۔ کبھی کبھی ایک چھوٹا سا کنٹراسٹ موافقت پہاڑوں کو حرکت دیتا ہے۔ [4] -
لیبلز اور ڈیٹاسیٹس
باؤنڈنگ بکس، کثیر الاضلاع، کلیدی پوائنٹس، ٹیکسٹ اسپینز۔ متوازن، نمائندہ لیبلز- یا آپ کا ماڈل یک طرفہ عادات سیکھتا ہے۔ -
ماڈلنگ
-
درجہ بندی : "کون سا زمرہ؟"
-
کھوج : "آبجیکٹ کہاں ہیں؟"
-
Segmentation : "کون سے پکسلز کس چیز سے تعلق رکھتے ہیں؟"
-
کلیدی نکات اور پوز : "جوڑ یا نشانیاں کہاں ہیں؟"
-
OCR : "تصویر میں کون سا متن ہے؟"
-
گہرائی اور 3D : "سب کچھ کتنا دور ہے؟"
آرکیٹیکچرز مختلف ہوتے ہیں، لیکن convolutional nets اور transformer-style models حاوی ہیں۔ [1]
-
-
ٹریننگ
سپلٹ ڈیٹا، ٹیون ہائپر پیرامیٹر، ریگولرائز، بڑھانا۔ وال پیپر کو حفظ کرنے سے پہلے جلدی رک جانا۔ -
تشخیص
کام کے لیے موزوں میٹرکس جیسے MAP، IoU، F1، CER/WER OCR کے لیے استعمال کریں۔ چیری پک نہ کریں۔ منصفانہ موازنہ کریں۔ [3] -
ٹارگٹ کے لیے تعیناتی بڑھے ہوئے کی نگرانی کریں۔ جب دنیا بدل جائے تو دوبارہ تربیت دیں۔
بڑے ڈیٹاسیٹس اور کمپیوٹ کے اہم بڑے پیمانے پر آنے کے بعد گہرے جالوں نے ایک کوالٹی لیپ کو اتپریرک کیا۔ امیج نیٹ چیلنج جیسے بینچ مارکس نے اس پیشرفت کو مرئی اور بے لگام بنایا۔ [2]
بنیادی کام جو آپ اصل میں استعمال کریں گے (اور کب) 🧩
-
تصویری درجہ بندی : فی تصویر ایک لیبل۔ فوری فلٹرز، ٹرائیج، یا کوالٹی گیٹس کے لیے استعمال کریں۔
-
آبجیکٹ کا پتہ لگانا : چیزوں کے ارد گرد بکس۔ خوردہ نقصان کی روک تھام، گاڑی کا پتہ لگانے، جنگلی حیات کی گنتی۔
-
مثال کی تقسیم : پکسل درست سلیوٹس فی آبجیکٹ۔ مینوفیکچرنگ کے نقائص، جراحی کے اوزار، ایگریٹیک۔
-
سیمنٹک سیگمنٹیشن : کلاس فی پکسل مثالوں کو الگ کیے بغیر۔ شہری سڑک کے مناظر، زمین کا احاطہ۔
-
کلیدی نقطہ کا پتہ لگانا اور پوز : جوڑ، نشانات، چہرے کی خصوصیات۔ کھیلوں کے تجزیات، ایرگونومکس، اے آر۔
-
ٹریکنگ : وقت کے ساتھ اشیاء کی پیروی کریں۔ لاجسٹکس، ٹریفک، سیکورٹی.
-
OCR اور دستاویز AI : متن نکالنا اور لے آؤٹ پارس کرنا۔ رسیدیں، رسیدیں، فارم۔
-
گہرائی اور 3D : متعدد نظاروں یا یکطرفہ اشارے سے تعمیر نو۔ روبوٹکس، اے آر، میپنگ۔
-
بصری کیپشننگ : قدرتی زبان میں مناظر کا خلاصہ کریں۔ رسائی، تلاش۔
-
ویژن لینگویج ماڈلز : ملٹی موڈل استدلال، بازیافت بڑھا ہوا وژن، گراؤنڈ QA۔
چھوٹے کیس وائب: اسٹورز میں، ایک ڈٹیکٹر جھنڈا لگاتا ہے جس میں شیلف کا سامنا نہیں ہوتا ہے۔ ایک ٹریکر عملے کی بحالی کے طور پر دوہری گنتی کو روکتا ہے۔ ایک سادہ اصول کم اعتماد والے فریموں کو انسانی جائزے کی طرف لے جاتا ہے۔ یہ ایک چھوٹا آرکسٹرا ہے جو زیادہ تر دھن میں رہتا ہے۔
موازنہ کی میز: تیزی سے بھیجنے کے لیے ٹولز 🧰
جان بوجھ کر ہلکا نرالا۔ ہاں، فاصلہ عجیب ہے- میں جانتا ہوں۔.
| ٹول / فریم ورک | کے لیے بہترین | لائسنس/قیمت | یہ عملی طور پر کیوں کام کرتا ہے۔ |
|---|---|---|---|
| اوپن سی وی | پری پروسیسنگ، کلاسک CV، فوری POCs | مفت - اوپن سورس | بہت بڑا ٹول باکس، مستحکم APIs، جنگ کا تجربہ کیا گیا؛ کبھی کبھی آپ سب کی ضرورت ہے. [4] |
| پائی ٹارچ | تحقیق کے لیے دوستانہ تربیت | مفت | متحرک گراف، بڑے پیمانے پر ماحولیاتی نظام، بہت سے سبق. |
| TensorFlow/Keras | پیمانے پر پیداوار | مفت | بالغ پیش کرنے کے اختیارات، موبائل اور کنارے کے لیے بھی اچھے ہیں۔. |
| Ultralytics YOLO | تیز آبجیکٹ کا پتہ لگانا | مفت + بامعاوضہ ایڈ آنز | آسان ٹریننگ لوپ، مسابقتی رفتار کی درستگی، رائے پر مبنی لیکن آرام دہ۔. |
| ڈیٹیکٹرون 2 / ایم ایم ڈیٹییکشن | مضبوط بنیادی خطوط، تقسیم | مفت | قابل تولیدی نتائج کے ساتھ حوالہ گریڈ ماڈل۔. |
| OpenVINO / ONNX رن ٹائم | تخمینہ کی اصلاح | مفت | تاخیر کو دبائیں، دوبارہ لکھے بغیر وسیع پیمانے پر تعینات کریں۔. |
| ٹیسریکٹ | بجٹ پر او سی آر | مفت | اگر آپ تصویر کو صاف کرتے ہیں تو اچھے طریقے سے کام کرتا ہے… کبھی کبھی آپ کو واقعی کرنا چاہئے۔. |
🔧 میں کمپیوٹر وژن میں کیا چیز معیار کو آگے بڑھاتی ہے۔
-
ڈیٹا کوریج : روشنی کی تبدیلیاں، زاویے، پس منظر، کنارے کے کیسز۔ اگر ایسا ہو سکتا ہے تو اسے شامل کر لیں۔
-
لیبل کا معیار : متضاد بکس یا میلا کثیر الاضلاع تخریب کاری ایم اے پی۔ تھوڑا سا QA بہت آگے جاتا ہے۔
-
سمارٹ اضافہ : فصل کاٹیں، گھمائیں، چمکیلی چمک، مصنوعی شور شامل کریں۔ حقیقت پسند بنیں، بے ترتیب افراتفری نہیں۔
-
ماڈل سلیکشن فٹ : جہاں پتہ لگانے کی ضرورت ہو وہاں پتہ لگانے کا استعمال کریں- کسی درجہ بندی کو مقامات کا اندازہ لگانے پر مجبور نہ کریں۔
-
اثرات سے مماثل میٹرکس : اگر جھوٹے منفی سے زیادہ تکلیف پہنچتی ہے تو یاد کو بہتر بنائیں۔ اگر جھوٹے مثبت سے زیادہ تکلیف ہوتی ہے تو پہلے درستگی۔
-
سخت فیڈ بیک لوپ : لاگ فیل ہونے، دوبارہ بیلنا، دوبارہ تربیت دینا۔ کللا، دوبارہ. تھوڑا سا بورنگ - جنگلی طور پر موثر۔
پتہ لگانے/تقسیم کرنے کے لیے، کمیونٹی کا معیار IoU تھریشولڈز یعنی COCO طرز کے mAP اوسط درستگی کا ۔ یہ جاننا کہ IoU اور AP@{0.5:0.95} کی گنتی کیسے کی جاتی ہے لیڈر بورڈ کے دعووں کو اعشاریوں کے ساتھ آپ کو حیران کرنے سے روکتا ہے۔ [3]
حقیقی دنیا کے استعمال کے معاملات جو فرضی نہیں ہیں 🌍
-
ریٹیل : شیلف تجزیات، نقصان کی روک تھام، قطار کی نگرانی، پلانوگرام کی تعمیل۔
-
مینوفیکچرنگ : سطح کی خرابی کا پتہ لگانے، اسمبلی کی تصدیق، روبوٹ رہنمائی۔
-
صحت کی دیکھ بھال : ریڈیولوجی ٹرائیج، آلہ کا پتہ لگانے، سیل سیگمنٹیشن۔
-
نقل و حرکت : ADAS، ٹریفک کیمز، پارکنگ کی جگہ، مائیکرو موبلٹی ٹریکنگ۔
-
زراعت : فصلوں کی گنتی، بیماری کی نشاندہی، فصل کی تیاری۔
-
انشورنس اور فنانس : نقصان کا اندازہ، KYC چیک، دھوکہ دہی کے جھنڈے۔
-
تعمیر اور توانائی : حفاظت کی تعمیل، لیک کا پتہ لگانے، سنکنرن کی نگرانی۔
-
مواد اور رسائی : خودکار سرخیاں، اعتدال، بصری تلاش۔
پیٹرن آپ دیکھیں گے: دستی اسکیننگ کو خودکار ٹرائیج سے تبدیل کریں، پھر جب اعتماد کم ہو جائے تو انسانوں تک پہنچائیں۔ گلیمرس نہیں - لیکن یہ ترازو ہے۔.
ڈیٹا، لیبلز، اور میٹرکس جو اہم ہیں 📊
-
درجہ بندی : درستگی، عدم توازن کے لیے F1۔
-
پتہ لگانا : IoU دہلیز پر mAP؛ فی کلاس اے پی اور سائز کی بالٹیوں کا معائنہ کریں۔ [3]
-
انقطاع : mIoU, Dice; مثال کی سطح کی غلطیاں بھی چیک کریں۔
-
ٹریکنگ : MOTA، IDF1؛ دوبارہ شناخت کا معیار خاموش ہیرو ہے۔
-
OCR : کریکٹر ایرر ریٹ (CER) اور ورڈ ایرر ریٹ (WER)؛ ترتیب کی ناکامیاں اکثر غالب رہتی ہیں۔
-
رجعت کے کام : گہرائی یا پوز مطلق/رشتہ دار غلطیاں استعمال کرتے ہیں (اکثر لاگ اسکیلز پر)۔
اپنے تشخیصی پروٹوکول کو دستاویز کریں تاکہ دوسرے اسے نقل کر سکیں۔ یہ غیر سیکسی ہے - لیکن یہ آپ کو ایماندار رکھتا ہے۔.
تعمیر بمقابلہ خرید - اور اسے کہاں چلانا ہے 🏗️
-
کلاؤڈ : شروع کرنے میں سب سے آسان، بیچ کے کام کے بوجھ کے لیے بہترین۔ باہر نکلنے کے اخراجات دیکھیں۔
-
ایج ڈیوائسز : کم تاخیر اور بہتر رازداری۔ آپ کوانٹائزیشن، کٹائی، اور ایکسلریٹر کا خیال رکھیں گے۔
-
آن ڈیوائس موبائل : فٹ ہونے پر حیرت انگیز۔ ماڈلز کو بہتر بنائیں اور بیٹری دیکھیں۔
-
ہائبرڈ : کنارے پر پری فلٹر، بادل میں بھاری لفٹنگ۔ ایک اچھا سمجھوتہ۔
بورنگ طور پر قابل بھروسہ اسٹیک: PyTorch کے ساتھ پروٹو ٹائپ کریں، معیاری ڈٹیکٹر کو تربیت دیں، ONNX کو ایکسپورٹ کریں، OpenVINO/ONNX رن ٹائم کے ساتھ تیز کریں، اور پری پروسیسنگ اور جیومیٹری (کیلیبریشن، ہوموگرافی، مورفولوجی) کے لیے OpenCV کا استعمال کریں۔ [4]
خطرات، اخلاقیات، اور مشکل حصوں کے بارے میں بات کرنے کے لیے ⚖️
ویژن سسٹم ڈیٹاسیٹ کے تعصبات یا آپریشنل بلائنڈ اسپاٹس کو وراثت میں لے سکتے ہیں۔ آزاد تشخیصات (مثلاً، NIST FRVT) نے الگورتھم اور حالات میں چہرے کی شناخت کی خرابی کی شرح میں آبادیاتی تفریق کی پیمائش کی ہے۔ یہ گھبرانے کی وجہ نہیں ہے، لیکن یہ احتیاط سے جانچنے، دستاویز کی حدود، اور پیداوار میں مسلسل نگرانی کرنے کی ایک وجہ ہے اگر آپ شناخت یا حفاظت سے متعلق استعمال کے معاملات کو تعینات کرتے ہیں، تو انسانی جائزہ اور اپیل کے طریقہ کار کو شامل کریں۔ رازداری، رضامندی، اور شفافیت اختیاری اضافی چیزیں نہیں ہیں۔ [5]
ایک فوری طور پر شروع ہونے والا روڈ میپ جس کی آپ اصل میں پیروی کر سکتے ہیں 🗺️
-
فیصلے کی وضاحت کریں
تصویر دیکھنے کے بعد سسٹم کو کیا ایکشن لینا چاہیے؟ یہ آپ کو وینٹی میٹرکس کو بہتر بنانے سے روکتا ہے۔ -
ایک سکریپی ڈیٹاسیٹ جمع کریں
چند سو تصاویر کے ساتھ شروع کریں جو آپ کے حقیقی ماحول کی عکاسی کرتی ہیں۔ احتیاط سے لیبل لگائیں- چاہے یہ آپ ہی ہوں اور تین چپچپا نوٹ۔ -
ایک بیس لائن ماڈل منتخب کریں
پہلے سے تربیت یافتہ وزن کے ساتھ ایک سادہ ریڑھ کی ہڈی کا انتخاب کریں۔ ابھی تک غیر ملکی فن تعمیرات کا پیچھا نہ کریں۔ [1] -
ٹرین کریں، لاگ کریں،
ٹریک میٹرکس، کنفیوژن پوائنٹس، اور ناکامی کے طریقوں کا اندازہ کریں۔ "عجیب صورتوں" کی ایک نوٹ بک رکھیں - برف، چکاچوند، عکاسی، عجیب فونٹس۔ -
لوپ کو سخت کریں
سخت منفی شامل کریں، لیبل ڈرفٹ کو ٹھیک کریں، اضافہ کو ایڈجسٹ کریں، اور حد کو دوبارہ بنائیں۔ چھوٹی چھوٹی تبدیلیاں شامل ہیں۔ [3] -
ایک سلم ورژن
کوانٹائز اور ایکسپورٹ کریں۔ حقیقی ماحول میں تاخیر/تھرو پٹ کی پیمائش کریں، کھلونا بینچ مارک نہیں۔ -
نگرانی کریں اور اعادہ کریں
غلط فائرز کو جمع کریں، دوبارہ منسلک کریں، دوبارہ تربیت دیں۔ وقتاً فوقتاً جائزوں کا شیڈول بنائیں تاکہ آپ کا ماڈل فوسلائز نہ ہو۔
پرو ٹِپ: آپ کے انتہائی گھٹیا ساتھی کے ذریعے سیٹ کردہ ایک چھوٹے سے ہولڈ آؤٹ کی تشریح کریں۔ اگر وہ اس میں سوراخ نہیں کر سکتے ہیں، تو آپ شاید تیار ہیں۔
عام باتوں سے آپ بچنا چاہیں گے 🧨
-
صاف سٹوڈیو امیجز پر تربیت، عینک پر بارش کے ساتھ حقیقی دنیا میں تعینات۔.
-
جب آپ واقعی ایک اہم طبقے کی پرواہ کرتے ہیں تو مجموعی ایم اے پی کو بہتر بنانا۔ [3]
-
طبقاتی عدم توازن کو نظر انداز کرنا اور پھر سوچنا کہ نایاب واقعات کیوں غائب ہو جاتے ہیں۔.
-
حد سے زیادہ بڑھانا جب تک کہ ماڈل مصنوعی نمونے نہیں سیکھتا۔.
-
کیمرے کیلیبریشن کو چھوڑنا اور پھر نقطہ نظر کی غلطیوں سے ہمیشہ کے لیے لڑنا۔ [4]
-
درست تشخیصی سیٹ اپ کو نقل کیے بغیر لیڈر بورڈ نمبروں پر یقین کرنا۔ [2][3]
بُک مارکنگ کے قابل ذرائع 🔗
اگر آپ کو بنیادی مواد اور کورس کے نوٹس پسند ہیں، تو یہ بنیادی باتوں، مشقوں اور بینچ مارکس کے لیے سونا ہیں۔ حوالہ جات کا دیکھیں : CS231n نوٹس، امیج نیٹ چیلنج پیپر، COCO ڈیٹاسیٹ/تشخیصی دستاویزات، OpenCV دستاویزات، اور NIST FRVT رپورٹس۔ [1][2][3][4][5]
حتمی ریمارکس - یا بہت طویل، نہیں پڑھا 🍃
AI میں کمپیوٹر وژن پکسلز کو فیصلوں میں بدل دیتا ہے۔ یہ چمکتا ہے جب آپ صحیح کام کو صحیح ڈیٹا کے ساتھ جوڑتے ہیں، صحیح چیزوں کی پیمائش کرتے ہیں، اور غیر معمولی نظم و ضبط کے ساتھ اعادہ کرتے ہیں۔ ٹولنگ فیاض ہے، بینچ مارکس عوامی ہیں، اور اگر آپ حتمی فیصلے پر توجہ مرکوز کرتے ہیں تو پروٹو ٹائپ سے پیداوار تک کا راستہ حیرت انگیز طور پر مختصر ہے۔ اپنے لیبلز کو سیدھا کریں، اثرات سے مماثل میٹرکس کا انتخاب کریں، اور ماڈلز کو ہیوی لفٹنگ کرنے دیں۔ اور اگر کوئی استعارہ مدد کرتا ہے - اس کے بارے میں سوچنا جیسے کہ ایک بہت تیز لیکن لفظی انٹرن کو سکھانا کہ کیا اہم ہے۔ آپ مثالیں دکھاتے ہیں، غلطیوں کو درست کرتے ہیں، اور آہستہ آہستہ حقیقی کام کے ساتھ اس پر بھروسہ کرتے ہیں۔ کامل نہیں، لیکن تبدیلی لانے کے لیے کافی قریب ہے۔ 🌟
حوالہ جات
-
CS231n: ڈیپ لرننگ فار کمپیوٹر وژن (کورس نوٹس) - سٹینفورڈ یونیورسٹی۔
مزید پڑھیں -
امیج نیٹ بڑے پیمانے پر بصری شناخت کا چیلنج (کاغذ) - روساکوسکی وغیرہ۔
مزید پڑھیں -
COCO ڈیٹاسیٹ اور تشخیص - سرکاری سائٹ (ٹاسک کی تعریفیں اور mAP/IoU کنونشنز)۔
مزید پڑھیں -
OpenCV دستاویزی (v4.x) - ماڈیولز برائے پری پروسیسنگ، کیلیبریشن، مورفولوجی، وغیرہ
مزید پڑھیں -
NIST FRVT حصہ 3: آبادیاتی اثرات (NISTIR 8280) - پورے ڈیموگرافکس میں چہرے کی شناخت کی درستگی کا آزادانہ جائزہ۔
مزید پڑھیں