盡管在技術上需要更加精進,但行(xíng)為(wèi)識别已經開始走向一(yī)些場景。
根據中商(shāng)産業研究院發布的(de)《2019-2024年(nián)中國(guó)機(jī)器視(shì)覺行(xíng)業前景及投資機(jī)會研究報告》顯示,2018年(nián)中國(guó)機(jī)器視(shì)覺市(shì)場規模首次超過100億元;而随着行(xíng)業技術提升、産品應用領域拓展,機(jī)器視(shì)覺市(shì)場将進一(yī)步擴大,預計在2019年(nián)機(jī)器視(shì)覺市(shì)場規模将近125億元。
的(de)确CV(機(jī)器視(shì)覺)行(xíng)業的(de)市(shì)場規模不小、也有(yǒu)利可(kě)圖,但當技術産品紛紛成熟開始走向落地(dì)應用的(de)時候,如(rú)何吃到這塊蛋糕,成為(wèi)了衆多CV創企們(men)所面臨的(de)最大難題。與此同時,持續虧損、盈利壓力也在催促着每家CV企業努力“奔跑”。
趨視(shì)科(kē)技并不屬于CV領域最知名的(de)行(xíng)業,然而它們(men)卻在落地(dì)應用和(hé)盈利上先人一(yī)步,其公司創始人徐飙表示:“如(rú)果行(xíng)業內(nèi)90%的(de)企業都在虧損,我(wǒ)們(men)則屬于另外那10%。”
它們(men)是如(rú)何做(zuò)到的(de)呢(ne)
圖 | 趨視(shì)科(kē)技創始人徐飙
CV不僅有(yǒu)人臉識别,還有(yǒu)行(xíng)為(wèi)分析
談及CV,關注度和(hé)話題往往都集中于人臉識别領域,商(shāng)湯、曠視(shì)等更是行(xíng)業內(nèi)外關注的(de)焦點,但CV并不等同于人臉識别,它還包括行(xíng)為(wèi)識别。徐飙介紹,趨視(shì)科(kē)技在成立至今一(yī)直都瞄準的(de)是行(xíng)為(wèi)識别。
“行(xíng)為(wèi)識别就是識别人類或者車的(de)行(xíng)為(wèi),比如(rú)人的(de)打架行(xíng)為(wèi)、汽車闖紅(hóng)燈行(xíng)為(wèi)等。雖然都屬于機(jī)器視(shì)覺,但人臉識别和(hé)行(xíng)為(wèi)識别是兩個技術、不同領域。”
技術層面,人臉識别通過一(yī)張照片就能完成,而行(xíng)為(wèi)識别則需要通過連續數據結合起來進行(xíng)判斷,因為(wèi)行(xíng)為(wèi)本身是一(yī)個連續動态的(de)過程。簡而言之,人臉識别解決的(de)是目标對象是誰的(de)問題,而行(xíng)為(wèi)解決的(de)是做(zuò)了什麼樣的(de)事。目前行(xíng)為(wèi)識别往往用于司法管理(lǐ)、智慧門店、智能社區等場景。
徐飙告訴我(wǒ)們(men):“行(xíng)為(wèi)識别适用的(de)領域非常多,但當前由于技術不夠成熟,面對太過複雜且并不标準的(de)場景,行(xíng)為(wèi)識别技術很難發揮出很好的(de)效果。所以該技術隻能在一(yī)些垂直場景中先應用起來,慢慢地(dì)在應用過程中不斷的(de)積累、提升技術,以此擴展到更多場景,最終滿足整個大範圍內(nèi)人類對行(xíng)為(wèi)認知的(de)要求。”
那麼行(xíng)為(wèi)識别的(de)技術難點究竟是什麼呢(ne)?
由于行(xíng)為(wèi)是多樣化的(de)話,它包括個體行(xíng)為(wèi)、群體行(xíng)為(wèi),具體每個行(xíng)為(wèi)的(de)表現方式也并不相同。比如(rú)打架行(xíng)為(wèi)和(hé)偷竊行(xíng)為(wèi)、一(yī)個人與一(yī)個人之間的(de)打架和(hé)群體之間的(de)打架行(xíng)為(wèi)等都全然不同,因此行(xíng)為(wèi)識别在數據采集層面就面臨很大的(de)困難,其中主要涉及遮擋、錯位等問題。
同時人類看待世界的(de)角度是三維的(de),而攝像頭采集到的(de)畫面是二維,因此會造成視(shì)頻中有(yǒu)一(yī)個人露出了一(yī)隻胳膊,但由于視(shì)頻無法采集到距離(lí)參數,所以遮擋、錯位的(de)現象會讓AI算法難以判斷。
其次學(xué)習數據欠缺。衆所周知,許多AI技術依靠深度學(xué)習算法模型去(qù)訓練,這導緻要讓AI實現行(xíng)為(wèi)識别,就必須先給行(xíng)為(wèi)下定義,讓AI知道(dào)行(xíng)為(wèi)是什麼。然而前面已經提到行(xíng)為(wèi)非常複雜,甚至很多時候AI需要學(xué)習判斷的(de)是負面行(xíng)為(wèi),因此企業很難獲取到大量的(de)學(xué)習數據。而算法模型沒有(yǒu)經過大量數據去(qù)訓練,也就很難“聰明”起來,從而在識别的(de)效果和(hé)精度上難以達到用戶需求。
不過盡管在技術上需要更加精進,但行(xíng)為(wèi)識别已經開始走向一(yī)些場景。
CV企業破冰關鍵:規模化
徐飙介紹:“公司一(yī)開始關注的(de)就是行(xíng)業落地(dì)而非通用場景,且瞄準的(de)第一(yī)個領域就是司法領域行(xíng)業的(de)管理(lǐ),比如(rú)監獄管理(lǐ),是否有(yǒu)犯人打鬥、翻牆、攀爬等。這對于司法領域的(de)管理(lǐ)而言是一(yī)個剛需,能夠降低(dī)人力管理(lǐ)成本,提升管理(lǐ)質量。”
而行(xíng)業落地(dì)和(hé)通用場景落地(dì)兩條路徑的(de)最大區别,在徐飙看來,前者能夠助力企業快速實現規模化落地(dì),而這至關重要。
他談到:“所有(yǒu)CV廠商(shāng)在近年(nián)來特别強調落地(dì),本質上就是規模化落地(dì),即企業在一(yī)個項目試點實現技術落地(dì)後能夠快速複制到下一(yī)個同類型的(de)場景中,而不是做(zuò)完一(yī)個試點,下一(yī)個場景再重新做(zuò)一(yī)遍,這無疑增加了許多成本。”
對于企業而言,要實現規模化落地(dì)首先在最初尋找落地(dì)行(xíng)業時,就要找到能夠實現規模化、可(kě)複制性強的(de)場景。其中的(de)關鍵在于,企業對于用戶核心訴求的(de)把握是否精确。徐飙認為(wèi),CV企業要實現規模化必須了解用戶的(de)需求,所謂需求指的(de)不僅是用戶對于功能的(de)需求,還包括用戶對性能當中準确度的(de)要求。
“這需要碰撞。有(yǒu)些時候沒有(yǒu)人會告訴你他的(de)需求和(hé)對準确度的(de)要求是什麼,企業往往需要通過試點、交流、反饋、修正......逐步形成一(yī)個行(xíng)業共識,而并非單個客戶的(de)需求。”
但即便把握了用戶需求和(hé)性能指标并不足夠,企業還要評估自(zì)身的(de)技術體系、優勢能否滿足用戶的(de)需求和(hé)指标。最後企業還要考慮實現規模化之後,是否會被競品取代,這要求其必須在技術落地(dì)應用過程中打造自(zì)身的(de)技術門檻,如(rú)此廠商(shāng)們(men)才能率先占領市(shì)場,并在後續的(de)競争中獲勝。
回到趨視(shì)科(kē)技自(zì)身,徐飙談道(dào):“公司明年(nián)的(de)短(duǎn)期計劃,一(yī)方面是确保在司法行(xíng)業實現規模化,創造更多的(de)收益;同時也會将技術落地(dì)到智慧門店場景。小規模化帶給我(wǒ)們(men)盈利,也驗證了技術已經達到可(kě)複制狀态,所以我(wǒ)們(men)将會向更大的(de)市(shì)場進行(xíng)布局。”
【鎂客·請講】欄目 策劃&撰寫:溫暖
上一(yī)篇
徐飙先生受邀參加2019《市(shì)民與社會·對...下一(yī)篇
安博會的(de)喜與憂