摘要:隨著老年人口比重的不斷升高,中國的人口老年化現(xiàn)象日益突出,如何利用科學(xué)的方法和先進(jìn)的技術(shù)對這一現(xiàn)象進(jìn)行改善顯得尤其重要。文中提出基于物聯(lián)網(wǎng)、機(jī)器視覺、機(jī)器學(xué)習(xí)等技術(shù)的智能家庭機(jī)器人設(shè)計(jì)方案,以樹莓派作為機(jī)器人處理核心、STM32單片機(jī)輔助操控硬件模塊,利用物聯(lián)網(wǎng)技術(shù)、OpenCV機(jī)器視覺技術(shù)、智能語音交互、機(jī)器學(xué)習(xí)等來實(shí)現(xiàn)老人身體健康狀況的智能監(jiān)測和分析、家電的智能控制、室內(nèi)監(jiān)控,家人通信等功能。智能家庭機(jī)器人作為一種服務(wù)型人工智能產(chǎn)品,極大地節(jié)省了年輕人的時間與精力,高度符合市場的需求和時代的發(fā)展。
本文源自物聯(lián)網(wǎng)技術(shù),2020,10(10):82-83.《物聯(lián)網(wǎng)技術(shù)》雜志是經(jīng)國家新聞出版總署批準(zhǔn)的物聯(lián)網(wǎng)專業(yè)科技期刊。雜志為月刊,每月20日出版,現(xiàn)已是中國核心期刊(遴選)數(shù)據(jù)庫收錄期刊,中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫收錄期刊,中文科技期刊數(shù)據(jù)庫收錄期刊,龍?jiān)磭H期刊網(wǎng)全文收錄期刊,中國科技論文在線收錄期刊。
引言
根據(jù)國家統(tǒng)計(jì)局2016年公布的數(shù)據(jù)顯示,我國60歲以上的老年人超過2.3億,且老年人口規(guī)模不斷擴(kuò)大。隨著人口年齡結(jié)構(gòu)急劇變化,人們的生活節(jié)奏越來越快,老年人往往不能得到周到的照料。為了順應(yīng)社會的轉(zhuǎn)變,充分考慮當(dāng)今的科技進(jìn)步和時代發(fā)展,本文設(shè)計(jì)一種基于物聯(lián)網(wǎng)的智能家庭機(jī)器人。智能家庭機(jī)器人作為一種服務(wù)型人工智能可以更好地解決養(yǎng)老問題,讓老年人享受到更高品質(zhì)的生活的同時,也大大減輕年輕人與社會的壓力。
1、系統(tǒng)總體結(jié)構(gòu)
本文系統(tǒng)總體結(jié)構(gòu)如圖1所示。
圖1系統(tǒng)結(jié)構(gòu)設(shè)計(jì)
該系統(tǒng)的機(jī)器人集合各種模塊進(jìn)行設(shè)計(jì),以樹莓派為處理核心,搭載Linux系統(tǒng),以STM32芯片輔助連接各個模塊。機(jī)器人的底盤主要由兩個直流減速電機(jī)、激光雷達(dá)、SLAMWARE模塊、自動充電模塊和超聲波模塊組成,中間部分安裝功放模塊、煙霧檢測模塊和鋰電池組,上部安裝麥克風(fēng)陣列板、語音增強(qiáng)核心板和樹莓派核心板,頭部搭載舵機(jī)云臺、攝像頭模塊、遙控模塊和心率檢測模塊。
2、系統(tǒng)硬件設(shè)計(jì)
2.1數(shù)據(jù)處理與控制核心
設(shè)計(jì)采用樹莓派4B作為數(shù)據(jù)的處理核心,并加上STM32芯片及其他硬件模塊MCU的輔助完成各個硬件模塊的數(shù)據(jù)處理與控制。樹莓派4B型搭載了基于Cortex-A72架構(gòu)的64位四核處理器BCM2711,主頻可達(dá)1.5GHz,性能強(qiáng)勁,并集成了雙頻WiFi模塊和Bluetooth5.0模塊,可以非常便捷地連接互聯(lián)網(wǎng)及家中的智能設(shè)備,同時外接上EMMC存儲器進(jìn)一步提升其數(shù)據(jù)的讀寫性能。在樹莓派上可以運(yùn)行多種Linux系統(tǒng)或Windows10IoTCore系統(tǒng),有圖形界面和眾多SDK的支持,可以更加簡單快速的進(jìn)行開發(fā),同時能夠簡單高效的進(jìn)行程序線程的處理,系統(tǒng)的穩(wěn)定性也能得到保障。
2.2語音交互模組
語音交互模組設(shè)計(jì)如圖2所示。語音交互模組包括:環(huán)形麥克風(fēng)陣列[1]模塊、語音增強(qiáng)[2]核心、功放模塊。
首先得明確該機(jī)器的的語音識別環(huán)境是在室內(nèi),相比手機(jī)上的近場語音交互,其環(huán)境更加苛刻,人的聲源位置是不斷變化的,還會有背景噪音、混響、回聲、多人聲混肴等多種干擾因素。面對這樣的遠(yuǎn)場語音識別[3]環(huán)境,語音前端的設(shè)備和算法的處理十分重要。設(shè)計(jì)采用“環(huán)形6+1”麥克風(fēng)陣列方案,配合語音增強(qiáng)模塊的算法可以有效增強(qiáng)遠(yuǎn)場拾音能力和抑噪能力。主流的麥克風(fēng)陣列拾音流程分為回聲抵消[4]、聲源定位[5]、波束形成[6]、去混響[7]、信號增益這幾個步驟,這些需要前端通過算法完成,而且需要不間斷地實(shí)時監(jiān)聽運(yùn)算,顯然無法通過樹莓派來完成這些算法,而必須借助專用的語音處理單元。如今,市面上如百度、科大訊飛等公司都推出了功能完善的麥克風(fēng)陣列模塊和語音增強(qiáng)模塊,無需理解其復(fù)雜的算法便可以完成語音信號的前端處理。再通過樹莓派接入云端語音識別RestfulAPI和TTS語音引擎,完成語音的識別、自然語言理解、業(yè)務(wù)邏輯分析、語音合成和語音模型的訓(xùn)練。
圖2語音交互模組設(shè)計(jì)
2.3自主定位導(dǎo)航部分
機(jī)器人的自主定位導(dǎo)航[8]包括:自主定位、自動地圖建模和自主路徑規(guī)劃,還需要實(shí)時自動避障,并在環(huán)境發(fā)生變化時重定位。
本設(shè)計(jì)采用SLAMTEC思嵐科技的自主定位導(dǎo)航套裝:RPLIDAR激光雷達(dá)加SLAMWARE自主定位導(dǎo)航核心。SLAMWARE核心集成了9自由度的IMU,內(nèi)置了SLAM算法[9]引擎、改良的D*算法[10],配合激光雷達(dá)可以自動快速完成機(jī)器人的定位、建圖和路徑規(guī)劃。并且思嵐科技提供了SLAMWARESDK,可以在電腦上通過串口連接SLAMWARE核心方便地查看實(shí)時地圖、修改參數(shù)和命令等。SLAMWARE還提供了算法和API接口配合超聲波傳感器、防跌落傳感器,完成實(shí)時自動避障和激光雷達(dá)測量受阻時的重定位。SLAMWARE還提供了“自動回巢”的算法,以實(shí)現(xiàn)機(jī)器人的自動回充[11]。
2.4其他模塊
家電遙控模塊:由紅外遙控模塊和WiFi模塊組成。
心率檢測模塊:使用MAX30102心率血氧檢測模塊。
攝像頭模塊:考慮到攝像頭需要完成室內(nèi)監(jiān)控、視頻通話、人臉識別、物品識別等功能,攝像頭模塊采用無畸變、可夜視的高清攝像頭,同時加裝由兩個微型舵機(jī)組成的自動云臺來自動調(diào)整攝像的視角。
煙霧檢測模塊:由MQ-2,MQ-5,ME3-CO和ME3-H2S等多個不同的煙霧檢測傳感器組成,主要檢測室內(nèi)氣體的天然氣、液化氣、甲烷、一氧化碳、硫化氫等氣體的濃度。
3、系統(tǒng)軟件設(shè)計(jì)
機(jī)器人的軟件系統(tǒng)由樹莓派、語音增強(qiáng)核心、SLAMWARE核心和云端服務(wù)器4部分進(jìn)行分模塊的處理。樹莓派作為主系統(tǒng)負(fù)責(zé)其他模塊的連接調(diào)用、進(jìn)程的調(diào)配、本地語音識別、云端的數(shù)據(jù)交互等任務(wù)。語音增強(qiáng)核心負(fù)責(zé)語音識別的前端聲音處理,SLAMWARE負(fù)責(zé)機(jī)器人的自主定位導(dǎo)航功能,云端服務(wù)器負(fù)責(zé)語音、語義的識別,做出對應(yīng)的執(zhí)行邏輯處理,合成應(yīng)答語音,并返回命令和語音數(shù)據(jù)給機(jī)器人終端。其流程圖如圖3所示。
圖3機(jī)器人系統(tǒng)工作流程
4、結(jié)語
本文設(shè)計(jì)了一種以語音為核心交互方式,集成多種智能服務(wù)的家庭養(yǎng)老監(jiān)護(hù)機(jī)器人。以機(jī)器人作為智能中樞,借助簡單的語音交互,使老人能夠簡便地使用眾多的智能家電,給千萬家庭帶來生活質(zhì)量的提升。
參考文獻(xiàn):
[1]支艷利,張?jiān)苽?基于環(huán)形麥克風(fēng)陣列的遠(yuǎn)場語音識別系統(tǒng)[J].微型電腦應(yīng)用,2017,33(4):62-64.
[2]王義圓,張曦文,周貽能,等.基于麥克風(fēng)陣列的語音增強(qiáng)與干擾抑制算法[J].電聲技術(shù),2018,42(2):1-5.
[3]支艷利,張?jiān)苽?基于環(huán)形麥克風(fēng)陣列的遠(yuǎn)場語音識別系統(tǒng)[J].微型電腦應(yīng)用,2017,33(4):62-64.
[4]黃翔.基于麥克風(fēng)陣列的回聲抵消系統(tǒng)研究[D].武漢:湖北工業(yè)大學(xué),2018.
[5]汪家冬.面向智能機(jī)器人應(yīng)用的聲源定位系統(tǒng)研究[D].廣州:廣州大學(xué),2018.
[6]魏序,趙平,譚晶晶.基于波束形成與多參考源噪聲對消的語音增強(qiáng)算法[J].計(jì)算機(jī)與現(xiàn)代化,2011,26(12):45-47.
[7]孫博.語音信號去混響研究[D].沈陽:沈陽理工大學(xué),2018.
[8]王鵬.導(dǎo)航機(jī)器人的地圖構(gòu)建和定位研究[D].天津:天津工業(yè)大學(xué),2018.
[9]高文研,平雪良,貝旭穎,等.兩種基于激光雷達(dá)的SLAM算法最優(yōu)參數(shù)分析[J].傳感器與微系統(tǒng),2018,37(4):28-30.
[10]張希聞,肖本賢.改進(jìn)D*算法的移動機(jī)器人路徑規(guī)劃[J].傳感器與微系統(tǒng),2018,37(12):52-54.
[11]肖奇軍,鄭健聰,陳斯鵬,等.一種基于地圖構(gòu)建與角度傳感器的掃地機(jī)器人自動回充方法[J].機(jī)械與電子,2019,37(2):78-80.
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >