运动感知为人们学习和娱乐的方式以及交互本身都带来了巨大的变化,图形用户界面(GUI)和笔式用户界面都是目前主要的交互方式。在未来的若干年内,随着计算机硬件和交互技术的提高,未来交互方式将突破旧的图形用户界面和笔式用户界面的约束,不受空间、时间和人的限制,而能提供更为个性化的服务88。为了应对这些变化,研究基于身体运动的体感计算交互模型是非常重要的。因为人们可以通过身体运动和接触运动感知设备、应用程序、信息服务等体验科技的进步,所以在人机交互的自然化和智能化上起到了非常重要的作用。体感计算的交互与计算模型可以借鉴情感计算的方法,从用户感觉和系统逻辑的角度进行的抽象描述,交互模型的构造决定了体感计算具体的交互方式。
本章首先概述了体感计算的交互模型,以及与图形用户界面和笔式用户界面交互模型特征对比,随后探讨了基于运动感知的体感交互模型,以及体感行为模型和交互虚拟化身。
6.1体感交互模型的概述
6.1.1体感交互的概念模型
体感计算交互模型是开发一个实用体感人机交互系统的基础,目前还没有一个标准的体感计算交互模型。当人类与体感计算系统进行交互时,体感系统的基本功能就是准确识别用户的交互意图和体感状态,并提供适时的个性化的交互信息反馈。在体感交互系统中对于用户而言只有用户界面和交互设备是直接可以感知和操纵的,身体运动行为决定了整个体感计算系统的行为。
本书提出了一个体感计算交互的概念模型,如图6.1所示,本书提出的概念模型的作用是清楚地描述体感计算系统运行的逻辑,系统在进行体感动作的语义分析和识别后,首要任务就是在应用语义和用户语义之间进行翻译,例如将用户的音乐指挥的44拍手势准确的识别出来。由于体感计算交互模型的核心思想是充分发挥人和计算机的体感感知能力,来达到智能的自然人机交互,因此体感计算的交互模型通过一些输入通道的组合,将用户的体感交互语义翻译为系统存贮的应用语义,然后再将应用语义翻译为用户语义。所以,在体感计算系统中要储备足够的体感语义和信号语义的数据库,以便于体感信号精确解码和识别。
6.1.2体感交互的概念模型
体感交互相对于图形用户界面和笔式用户界面的交互模型,具有有如下所示的基本特点:
1.体感交互的双向性:
人的身体运动和感觉效应通道通常具有双向性的特点,比如人的身体可接收、可体验感知,手可以控制、可触摸感觉、可运动、可表达和操纵等。而在人机交互中,手势通道的双向交互可通过运动传感器、摄像头、深度传感器或者数据手套来完成,听觉通道也可利用多点阵列麦克风、语音识别和三维听觉定位器来实现,人类大多数的体感表达活动都具有三维和可直接操纵的双向性特点。而在图形用户界面和笔式用户界面的交互中,需要全身单向的交互功能,键盘、鼠标、手写笔和手写板可以作为一种输入装置,显示屏可以作为一种输出装置,而人的眼睛可以是信息接收通道。
2.体感交互的自然和非精确性:
人在日常生活中习惯使用非精确的信息交流方式。人类的身体动作语言本身就具有高度的模糊性。体感交互允许使用模糊的表达方式,身体运动语言可以避免不必要的认知负荷,有利于提高体感计算交互中的自然性和高效性,所以也很适合面向个性化的学习体验,促进人在学习中的体验性认知。然而,在图形用户界面和笔式用户界面中,人与计算机是以精确的方式进行交互的,所以无法进行个性化的学习体验。
3.体感交互的隐喻性:
体感交互模型使得用户把所有的注意力集中于完成任务而无需为界面使用方法而分心,也就是说,体感计算的用户界面对用户而言是极其简单易懂的。智能化的体感计算交互只需要用户将其交互意图用身体语言来告诉计算机,计算机就会自动完成所需要的相应工作,甚至用户不必要告诉系统自己的需求,计算机也可以根据体感系统的数据库知识去分析推理,用机器学习的方法去自动的为用户服务。然而,在图形用户界面和笔式用户界面,特别是命令后的第二代人机交互,是基于图形方式的,主要是遵循的是办公桌面的隐喻。
6.1.3基于运动感知的体感交互模型
本节提出的基于运功传感器的体感交互模型,主要是从理论上和整体上描述了使用运动传感器的用户与计算机的体感交互活动。随着计算机系统的底层技术越来越强大和复杂,交互方式将会变得越来越简洁明了,更容易理解和操作,以便用户把更多的注意力集中在目的本身,而不是在研究操作的媒介上。所以不论是交互模型的管理系统,还是用户界面的交互媒介,都应该是更为自然、直观的方式,并且使得应用系统开发与交互界面开发具有相对的独立性,这样便于交互模型的开放性与兼容性。
体感计交互的媒介除了本书重点讨论的运动传感器,还包括其他的视觉捕获设备等,而本节重点探讨运动传感器的体感交互模型。
基于运动传感器的体感交互模式的识别方法包括三大类,即模板匹配方法、结构模式识别、统计模式识别。在很多情况下,神经网络方法可以归到统计模式识别中。模板匹配模式识别是应用最早且最简单的模式识别,它通过比较待识别模式和已有模式的相似程度来达到识别模式的目的。
体感交互的虚拟化身是根据用户需求确定的性格和一些特征情感所设计出的,目的是允许体感虚拟化身能够与用户进行更为生动有趣的交互行为互动,能够表达其个性化的情绪和体感,研究在交互过程中的体感识别和反馈。如图6.2所示的基于运动传感器的体感计算模型,体感虚拟化身可以表达系统体感识别后的交互反馈信息。
自然的、个人化的、适应性的并且能够预见用户需求的实验环境还有待开发。这需要一系列的关键技术和软件,以及可以使系统设备进行互动操作的能力。这种平台应该能够从用户角度测试不同的技术解决方案,并且可以作为一个测试各种信息交互和通信的共同平台。
为了实现支持基于运动传感器的体感计算系统开发框架,可以使用以传感器运动的语义识别为基础的方法。另一方面,也可以考虑为实现全面可及性的开发方法,可以根据所有用户的各个不同特性以及使用条件自动进行调整的设计。同时,针对在完全智能环境下的动态对话系统的研究也可以实现个性化的体感交互,这些体感计算的交互实验应当利用用户的身体运动语言研究提供的各种需求。
人类的体感认知系统不仅能接收外界予以的所谓冲击,也能接收由原先冲击所产生的内部事件给予的冲击,也就是说,人类系统是一个反馈的循环。认知反馈将缓和人的身体反应,又能专心于此前的思维。反之,体感交互信息的反馈也可能增强人的反应,会使得对人的感觉激励上升到最高程度。
对于体感计算,可以有几种方式组织基础模块,第一种方式是通过表示的层次。信号属于低层次,模式属于中层次,概念属于高层次,这些组合在一起构成识别、表达体感的完整系统。
体感信号不仅可以从人类那里观察到,而且可以从外部环境中的非表现信号来感知到,这些信号表明是在哪里、正在做什么、情况如何等等。根据上下文信息,不仅可以通过低层次信号及模式,也可以通过高层次的方式推断在这种情境下,什么行为是最典型的,以及什么高层次目标在起作用。
体感计算系统在识别体感行为的过程中,通常涉及从信号到符号,从低层次的物理现象到高层次的抽象概念的转换。但是,因为对情境的推理能够修正做出的各种观察,信息的流动可被看做不只是从低层次输入到高层次,也可从高层次到低层次。假设根据情境判断,某人的身体行为表明正处在坏情绪中,这是人的高层次期望会造成人的低层次感知处于负面方式的偏见中,所以,很可能把较弱的,或模糊的行为认为是负面的,因此,对体感行为的认知不仅仅是“自底而上”,从信号到符号,也是“自顶而下”的,高层次的符号会影响信号处理的方式89。
但是,识别体感状态和系统表达体感状态是很不同的。对于人类,这种差别很模糊,因为所有人的体感状态都是自动和直观地影响识别和表达。但是对于计算机,需要明确这种差别,因为计算机只能建立这些能力的一个子集,要进行体感识别首先需要能够感知。体感与认知表达相互作用,和认知过程及物理过程两者相互作用,与高层次推理和低层次信号处理相互作用。
高层次推理和低层次信号在体感的表达的产生方面也联合起作用。假设一个音乐指挥家想演奏出一种怀有激愤的情绪,他开始想这个目标,然后开始酝酿低层次能流露出激愤的运动信号,通过改变身体姿势、手势行为来反映这种情感状态。这个过程从符号目标开始,以具有表现力的信号产生结束,所以听众可以听出所演奏的音乐的内在感受。试图表达某种情感的手势的过程,通常涉及从符号到信号,从高层次的概念到低层次的表达和行为调整之间的变换。
从提取的人所持有运动传感器的数据中,分析运动节奏与运动幅度,然后对用户的体感进行分类,记录下体感的特征类别,体感语义是由阈值决定某种特征的强度范围。如表6.1所示的基于运动传感器的体感分类示例:
6.2人的行为体验模型
除了体感计算交互模型之外,也需要设计满足基于运动感知要求的情感行为模型。本节探讨通过借鉴现有的人体行为研究的成果,进行体感行为体验模型的行为是身体在空间中做出运动变化的外形轨迹,行为体验模型包括了用户的身体设计与构建。
行为是身体在空间中做出运动变化的外形轨迹,行为体验模型包括了用户身体(图6.3)不同维度的运动:水平运动、垂直运动、车轮运动(源自Davies)体能量的运动和内部感觉体验的动态量值。
首先借鉴Laban50的舞蹈记谱语言的方法,身体动势可以被描述为三个不同维度的运动:水平的平面,垂直的平面和车轮运动的车轮平面。水平的运动能够被水平散布和延伸展开,垂直运动是以上下升降的维度来呈现,滚动的车轮运动是在前进和后退间运行,如图6.3所示的不同维度的运动示意图。
动态包含四个运动的因素:空间,权重,时间和流量。每个运动的因素都是一个两极间的闭连集。
在行为和情感的对应方面,应用Laban形体的理论,演员的体感行为解释如下所示:
激动-特别的延展,升起和前进的运动;
生气-有点延展,升起和前进运动;
惊恐-自闭,收敛,有点下降和后退;
不高兴-自闭,收敛,有点升高或者后退的运动;
惊喜-有点延展,在垂直平面的中立和向前的运动;
骄傲-有点延展,升高和有点前进的运动;
满意-在所有运动平面上的中立;
悲伤-自闭,下降或者后退的运动;
在爱中-有点延展,有点激昂和有点前进的运动。
从观察对于情感身体语言的分析,探讨的这9种情感,可以分为带有不同精力级别的3组,从最高精力的那个开始:
激动,生气,惊恐;
不高兴,惊喜,骄傲,满意;
忧伤,在爱中;
这些行为是情感表达的一个方式,身体运动的内在情感表达取决于人的背景和个人体验,不同的个性、文化等其他因素都会影响身体运动的姿态和量值。
在体验性认知中,从开始酝酿到越来越强烈的感受体验,表达越来越强烈,当这个感情产生然后用各种各样可选的表达来做出变化。
已经做出“形”和“情”两个变量,但是不同的运动体感的变量仍然有可能是一样的。比如快乐和生气有相同的形的表达,并且近似相同的精力图表。因此,可以通过寻找第三个变量,即唤醒度之间的阈值范围,比如在图6.7中,Russell的“效果的循形模型”所示的这样。
本书提出的体感行为模型设计的方法借鉴了以上人的行为体验方面的研究,需要根据面向不同应用情境的身体运动规律和语义来设计,在设计的整个过程可能有一系列方法包括:
评估搜集不同个性的特征、能力、需求和喜好的用户群体要求的方法;
具体的人文背景;
通过设计方法解决智能化的交互和适应,以及清晰明了的身体语言设计;
用以分析设计在哪种程度上达到了设计要求的评估方式,包括用以衡量体感计算系统适应性的主观问卷,以及衡量适应性、全面性等的一般标准;
计算机设计工具(例如开发与可及性相关的工具和为所有人设计的工具等)。
必须注意,由于体感交互的多维性和复杂性,需要使交互模型具有适当的适应性和兼容性。为了达到上述目标,如何为各种用户在不同平台上进行交互,并探讨在满足技术要求前提下的体感计算行为模型的设计方法。