安裝/部屬及設定資源

教學影片
IoT大平台之人臉辨識應用服務說明
課程簡介:
人臉辨識技術已被運用在無人商店、智能車、機器人、甚至是公共廁所等各種物聯網領域上面,本課程將介紹人臉辨識技術如何使用及IoT大平台人臉辨識API的使用方式。
先備知識:
程式語言基礎
適用對象:
物聯網應用開發人員
課程教材:
人臉辨識API功能介紹
常見問題
人臉辨識

問1:上傳照片格式?

答1:支援BMP、JPEG圖片檔案,上傳時需將檔案轉成base64文字格式後置於適當的JSON欄位。

問2:上傳照片中明明有人臉,為何系統回復沒有偵測到人臉?

答2:人臉偵測器在人臉偏大或偏小時容易無法偵測人臉的情形,請將人臉照片縮小或放大後再試一次,建議人臉大小約在100像素至300像素之間。其它如人臉角度不佳、光線不佳、白平衡不正常、模糊等因素亦可能造成人臉無法偵測情形。 下圖為光線佳的清晰正臉範例,圖片中包含人臉的方框尺寸請儘可能維持在100x100像素以上。

問3:系統有偵測到人臉但註冊人臉失敗?

答3:當系統偵測到2張以上人臉時,由於不確定使用者要註冊哪張人臉,因此會回覆失敗及所有人臉位置,使用者於收到人臉位置後可重新上傳照片並指定註冊人臉位置。

問4:人臉辨識相似分數意義?如何設定門檻值?

答4:分數愈高則代表兩張臉為同一人的機率愈高。門檻值建議可先設在0.9,再依照應用的嚴謹度需求微調。

人形偵測

問1:上傳照片格式?

答1:支援BMP、JPEG圖片檔案,上傳時需將檔案轉成base64文字格式後置於適當的JSON欄位。

問2:上傳照片中明明有人形,為何系統回復沒有偵測到人形?

答2:如果人形在照片中在偏小的情況下時容易漏偵測的情形,建議人形遮蔽範圍小於50%,人形高度大於影像高度1/5,視角俯角小於60度。

問3:圖片檔案大小是否有所限制?

答3:照片大小不拘,但過大的照片會需要較久的偵測時間。

人臉性別年齡辨識

問1:性別年齡辨識建議的人臉尺寸?

答1:建議為正面清晰人臉,並且圖片解析度大於 200x200,每張人臉大小大於 45x45 像素,以達到較佳辨識效果。

問2:性別年齡辨識上傳的圖片大小限制?

答2:無圖片大小限制,但圖片較大辨識等待時間將會較久。

問3:請問如何申請與使用API金鑰?

答3:您必須先去API金鑰管理頁面選擇欲使用的服務, 並產生一把API金鑰。透過API金鑰 ( 於Headers 輸入X-API-Key : { X_API_KEY } ) 使用「領域服務」與「智慧服務」API。詳細API金鑰使用說明可參考: API金鑰使用說明文件

語音合成

問1:為什麼我無法抓取回傳的音檔位址url?

答1:api文件有說明,由於對IoT API網址的任何存取都需要API 金鑰,因此在抓取音檔url時,header也需帶X-API-Key才能順利進行存取,所以無法直接透過一般的瀏覽器直接存取喔。

問2:請問如何申請與使用API金鑰?

答2:您必須先去API金鑰管理頁面選擇欲使用的服務, 並產生一把API金鑰。透過API金鑰 ( 於Headers 輸入X-API-Key : { X_API_KEY } ) 使用「智慧服務」API。詳細API金鑰使用說明可參考:API金鑰使用說明文件

問3:是否有範例程式可參考?

答3:請至下方github連結參考Java範例程式。https://github.com/TL-chenming/iot

語音辨識

問1:官網寫只限定上傳PCM格式,但嘗試MP3格式也可,故想知道還可以上傳哪些格式?

答1:資料格式每個sample需為signed short格式,在不壓縮的情況可以達到較佳的辨識效果,壓縮過的格式,因為失真,在解碼後可能會影響辨識效果。不確定您使用什麼語言將MP3格式讀入,但應該已經經過解碼轉成signed short格式存在buffer中,依據經驗,MP3的bitrate 需為96kbits/sec以上,才不會影響辨識率。

問2:請問如何申請與使用API金鑰?

答2:您必須先去API金鑰管理頁面選擇欲使用的服務, 並產生一把API金鑰。透過API金鑰 ( 於Headers 輸入X-API-Key : { X_API_KEY } ) 使用「智慧服務」API。詳細API金鑰使用說明可參考:API金鑰使用說明文件

問3:是否有範例程式可參考?

答3:請至下方github連結參考python範例程式。https://github.com/CHTTL820/CHT-IoT-STT-Sample/blob/master/test_iot_stt.py

下載

項目 說明 下載連結
AI 提供AI的說明文件 ASR回傳結果各欄位說明