一个物体存在于物理空间,如何和电脑世界联系起来,这是一个难题,在一个大的桌面上放置一个物体,解决它的身份问题,位置,朝向。针对这个人类已经做出了做够多的各式传感器,然而有着各种缺陷,所谓的万物互联依旧只是一个美好的传说,如何落地定位识别身份问题,针对这个问题我做了如下探索。
1.NFC 和 中距离RFID
在被识别物体中加入定位标签,通过读卡器来读取身份
这两个技术就是射频识别技术,问题是NFC标签可接受20cm以内的身份定位,但是超过这个距离力不从心,中距离RFID(50cm-100cm),这种技术缺陷在于一旦多个物体同时参与场景就无法区分了。变通的方法就是“刷卡一个上一个”即刷卡后系统识别物体进入场景,进而利用摄像机或者触摸屏跟踪到这个物体的位置,建立历史轨迹分析。但出现的问题是多个物体进入后,多个一起移动交叉就无能为例,因为身份在跟踪中非常容易丢失。
2 利用蓝牙技术
传统的蓝牙模块无线传输是低功耗的代表,可以巧妙的利用蓝牙协议对接时候,动态改变蓝牙设备的名字来实现通讯,但物体移动时候,摄像机跟踪定位,并且改变蓝牙名称为ID-Move,其他物体不移动为ID-Still,这样可以抓住身份。但这个很大的缺点就是所有物体同时移动的时候无法定位了。所以只能用于数量<3的物体跟踪识别。
3 利用LIFI技术定位
即在被跟踪物体上加入一个红外LED,用迷你单片机控制这个LED做频闪,(类似红外遥控),每个频闪频率不一样,可以参考摩斯码三长三短等等,然后顶部摄像机捕捉到这个频闪信息,解码后得到物体的身份和位置信息。如果在单片机里面植入陀螺仪指南针,也可以确定物体的朝向与加速度了。 针对这个我做了个样品,也成功实施在项目中,上实际的问题是供电问题,纽扣电池只能带动8小时(天天换电池不现实),5号电池能用一个月太大,需要植入底座或者物体内部。
vvvision | 互动投影 多点触摸 大屏幕触摸vvvision.net
4 电容屏定位技术
现在基于好的电容屏提供32点甚至80点的多点触摸输入,这个就给物体识别提供了一个方案,原理就当电容触点接触屏幕,屏幕提供点的位置,根据点的数量和间距和分布从而确定了物体的身份,最早在Ipad有个做儿童游戏利用了这个方式,google “smart letters interactive”
Smart Letters: interactive wooden letters for iPads
后期大的厂商开始涉及这块,例如3M 触摸屏。此方式优缺点很明显:优点是反应速度快能识别方向,缺点是需要一个大大的底座,底座需要充电,和非常昂贵的触摸屏本身。
5 手机代替物体做定位识别技术
在LIFI技术定位不成功后我尝试使用手机本身作为物体识别代替方案,利用摄像机检测手机方块这个特性来定位手机本身,通过利用手机传感器(陀螺仪的运动方向和摄像机识别的运动方向匹配一致即可实现身份的定位)用这个做了个儿童互动手机沙盘。
Youku Universal Player 视频地址
6 摄像机几何标签识别定位
利用卡片识别,卡片为特定的几何形状,摄像机识别卡片的形状做分析身份,优点是成本极低缺点是只能是卡片了,不能用实际物体。
VVVISION 蔚寻多媒体 -AR互动 小蝌蚪找妈妈
7 摄像机深度学习AI定位
由于这几年基于AI技术越来越普遍,让摄像机代替人眼自己判定物体,所以利用触摸屏定位加上摄像机对场景物体做深度学习即可完成对物体的身份判定,架构基于Tensorflow,事先训练大量的实物物体,然后放置物体后做预测,基本完成了识别任务。优点是无需底座标签,模型拿来直接用,缺点是目前无法提供物体方向信息。
VVVISION 蔚寻多媒体 -智能物体识别 视频地址
8 基于深度摄像机识别
鉴于Kinect 第三代即将问世,直接通过深度数据抓取物体轮廓,结合摄像机RGB数据这个就是未来的物体识别定位方向。
分享:
转载请注明:好现场 » 桌面物体识别定位技术介绍