凑合看
-
48 学时理论课(1-12 周)
-
48 学时实验课(3-14 周)
成绩构成:
- 50%:期末考试(闭卷,100 分)
- 50%:平时分
- 上课考勤及互动(10 分)
- 课后作业(30 分)
- 实验课设(50 分)
- 鼓励参加数媒大赛(10 分)
最后一节课上提到的重点:
- HCI 的定义(非常重要)
- 基于定义写例子
- HCI 三要素
- 格式塔心理学(基本原则要背)
- GUI 及其重要思想;WIMP
- 交互设备,投影仪,基本原理以及三步骤,分色调制云云
- 立体眼镜与工作原理;三类眼镜(比较重要)
- 各类交互技术;可能会要设计多通道(Multi-modal)交互方式
- 可用性分析与评估方案(大概会出设计题大题里)
其他大题综合 HCI 的四方面考虑作答,如图:

几乎不可能出现纯选填。题型可以参考上面 quote 的题目。
HCI 的定义:
人机交互从技术上讲(狭义的),主要是研究人与计算机之间的信息交换,它主要包括人到计算机和计算机到人的信息交换两部分:
- 人们如何借助键盘、鼠标、操纵杆、眼动跟踪器、位置跟踪器、数据手套、压力笔等(输入设备),用手、脚、声音、姿势或动作、眼睛甚至脑电波等向计算机传递信息(输入方式);
- 计算机如何通过打印机、显示器、头盔式显示器(HMD)、音响、力反馈等(输出设备)给人提供信息。
广义上讲,人机交互以实现自然、高效、和谐的人机关系为目的,与之相关的理论和技术都在其研究范畴,是计算机科学、心理学、认知科学以及社会学等学科的交叉学科。
研究开发新的人机交互设备、技术和理论,以实现无处不在计(ubiquitous computing)环境下的以用户为中心的交互式计算机系统,使其能够增强人的创造力,解放人类的大脑、改善人与人之间的交流与协作。
HCI 的三要素:
- Human 人
- 用户是与计算机系统交互的个人或一组个人。用户有特定的目标、需求、偏好和能力来驱动他们与系统的交互。
- 人的因素是交互计算机系统的物质基础,与用户的各种特征有关。
- 如:人有弱点:操作可能会出错;对计算机知识的掌握程度不同;用户年龄、文化层次、工作经历及职业不同,对操作使用的要求也不同。
- Computer 交互设备
- 交互设备构成了人机对话的基础,没有这些设备就无法让计算机了解用户的意图。
- 图形、图像输入输出设备,声音、姿势、触觉设备,三维交互设备等,而且这些交互设备也在不断的完善中,使得在交互过程中达到最佳的状态和效果。
- Interaction 交互
- 交互是人机交互系统的核心,向用户提供各种交互功能,以满足系统预定的要求。
- 交互设计对于塑造用户的技术体验至关重要,确保它是高效、直观的,并与用户的目标和期望保持一致。
格式塔心理学及其基本原则:
格式塔心理学:当视野中出现不完整因素时,视觉系统倾向于把它们完整起来,形成比较简单、稳定、正规化的图形。
- 简单律(minimum):视野中具有简单结构的部分,容易组成图形
- 邻近律/相近性(proximity):距离上相近的物体容易被知觉组织在一起
- 相似律/相似性(similarity):凡物理属性(颜色、形状、纹理)相近的物体容易被组织在一起
- 连续律(continuity):倾向于把经历最小变化或最少阻断的直线或者圆滑曲线知觉为一个整体
- 闭合律(closure):人们倾向于将缺损的轮廓加以补充使知觉成为一个完整的封闭图形
- 对称律:在视野中,对称的部分容易组成整体图形
- 协变律(The Law of Common Fate):同一运动趋向的元素会被归在一起
GUI 及其重要思想:
GUI 是图形用户界面(Graphical User Interface)的缩写,是一种通过图形、图像和视觉元素来显示和操作计算机程序的用户界面。
三个重要思想:
- 桌面隐喻(desktop metaphor)
- 所见即所得(What You See Is What You Get,WYSIWYG)
- 直接操纵(Direct manipulation)
GUI 设计的一般性原则:
-
界面要具有一致性:
- 在同一用户界面中,所有的菜单选择、命令输入、数据显示和其他功能应保持风格的一致性。
-
常用操作要有快捷方式:
- 不仅会提高用户的工作效率,还使界面在功能实现上简洁而高效。
-
提供简单的错误处理:
- 在出现错误时,系统应该能检测出错误,并且提供简单和容易理解的错误处理功能。
-
对操作人员的重要操作要有信息反馈:
-
操作可逆:
- 对大多数动作应允许恢复(UNDO),对用户出错采取比较宽容的态度。
-
设计良好的联机帮助:
- 人机界面应该提供上下文敏感的求助系统,让用户及时获得帮助,尽量用简短的动词和动词短语提示命令。
-
合理划分并高效地使用显示屏:
- 只显示与上下文有关的信息,允许用户对可视环境进行维护,如放大、缩小窗口;用窗口分隔不同种类的信息,只显示有意义的出错信息。
看看 WIMP:

至于投影仪,是一种可以将数字图像或视频投射到幕布上的设备。
投影仪的基本原理:
- 光学分色过程,将高亮度的白光光源分解为RGB三束光线,用于生成RGB三个位面的光学图像;
- 调制过程,即通过光阀器件,使RGB三束光线分别接受原始数字图像中RGB三个位面的调制,从而形成RGB三个位面的光学图像;
- 合成显示,将RGB三个位面的光学图像进行合成,并投射出去,完成数字图像到光学图像的转换。
立体眼镜主要用于观看立体电影或 3D 图像,通过不同的方式将左右眼看到的图像分离,从而产生立体效果。常见的立体眼镜有以下几种:
-
红蓝(或红绿、红青)立体眼镜:
- 这种眼镜使用红色和蓝色(或其他颜色)滤光片来分离左右眼的图像。
- 通常用于早期的 3D 电影和一些 3D 印刷材料。
-
偏振立体眼镜:
- 使用偏振滤光片来分离左右眼的图像。
- 常用于电影院的 3D 电影放映,如 IMAX 3D。
-
主动快门立体眼镜:
- 使用电子快门技术,通过快速交替遮挡左右眼来分离图像。
- 常用于家庭 3D 电视和一些高端 3D 显示设备。
-
分时立体眼镜:
- 利用时间分割技术,通过快速切换左右眼的图像来实现立体效果。
- 这种技术通常需要专门的显示设备和眼镜配合使用。
-
光栅立体眼镜:
- 使用微小的光栅或柱状透镜来分离左右眼的图像。
- 这种技术常用于裸眼 3D 显示器,但也有光栅眼镜的版本。
下面详细介绍偏振立体眼镜的原理:
偏振立体眼镜利用光的偏振特性来分离左右眼的图像。具体如下:
-
偏振光的基本概念:
- 光是一种电磁波,具有电场和磁场的振动方向。
- 自然光的振动方向是随机的,而偏振光的振动方向是固定的。
- 偏振光可以通过特定的滤光片(偏振片)来产生。
-
偏振滤光片:
- 偏振滤光片只允许特定方向的光波通过,而阻挡其他方向的光波。
- 例如,一个垂直偏振片只允许垂直方向振动的光通过,而阻挡水平方向振动的光。
-
偏振立体眼镜的工作原理:
- 在 3D 电影放映过程中,使用两台投影机或一台投影机配合特殊的偏振镜头来投射两幅图像,一幅图像为左眼观看,另一幅图像为右眼观看。
- 左眼图像通过一个偏振方向(例如垂直偏振),右眼图像通过另一个偏振方向(例如水平偏振或 45 度偏振)。
- 观众佩戴的偏振立体眼镜有两个偏振滤光片,左眼滤光片与左眼图像的偏振方向一致,右眼滤光片与右眼图像的偏振方向一致。
- 这样,左眼只能看到左眼图像,右眼只能看到右眼图像,左右眼看到的不同图像在大脑中融合,产生立体效果。
优点:
- 偏振立体眼镜轻便且价格低廉。
- 无需电池或电子元件,使用方便。
- 适合大规模观众使用,如电影院。
缺点:
- 需要专门的偏振投影设备和银幕。
- 视角和头部倾斜度有限制,超过一定角度会影响立体效果。
- 偏振光的效率可能受到环境光线的影响。
偏振立体眼镜因其简单有效的原理和较低的成本,广泛应用于电影院和一些 3D 展示场合。
首先 quote 一篇 CSDN 上的 数媒期末题。
一、简答题
Q:人机交互是什么
A:人机交互(Human-Computer Interaction, HCI)是研究人类(用户)与计算机系统之间相互作用的学科。其目的是设计和改进计算机系统,使其更易于使用、更高效和更愉快。HCI 涵盖了多个领域的知识,包括计算机科学、心理学、设计学、认知科学等,旨在理解用户需求、行为和体验,从而开发出更符合用户期望和习惯的技术和界面。
Q:人机交互经历了什么样的发展阶段
A:人机交互(HCI)的发展可以大致分为以下几个阶段,每个阶段都有其独特的技术和设计理念:
-
批处理阶段(1950s-1960s):
- 用户通过打孔卡片或纸带与计算机进行交互。
- 计算机处理任务需要很长时间,交互主要是单向的,用户提交任务后等待结果。
-
命令行界面阶段(1970s-1980s):
- 用户通过键盘输入命令与计算机交互。
- Unix 和 MS-DOS 是这一时期的典型操作系统。
- 需要用户具备一定的编程和命令行知识。
-
图形用户界面(GUI)阶段(1980s-1990s):
- 图形用户界面引入了图标、窗口和菜单,用户可以通过鼠标进行操作。
- 苹果的 Macintosh 和微软的 Windows 操作系统推动了 GUI 的普及。
- 使计算机更易于普通用户使用,极大地扩展了计算机的应用范围。
-
Web 和互联网阶段(1990s-2000s):
- 万维网的兴起改变了人机交互的方式,浏览器成为主要的交互平台。
- HTML、CSS 和 JavaScript 等技术使得网页设计和交互更加丰富。
- 用户可以通过互联网访问和分享信息,进行在线购物、社交等活动。
-
移动和触摸界面阶段(2000s-2010s):
- 智能手机和平板电脑的普及引入了触摸屏和手势操作。
- iOS 和 Android 操作系统推动了移动应用的发展。
- 用户可以随时随地进行交互,应用场景更加多样化。
-
自然用户界面(NUI)阶段(2010s-至今):
- 语音识别、手势识别、虚拟现实(VR)、增强现实(AR)等技术的应用。
- 智能助手(如 Siri、Alexa)、VR 头戴设备和 AR 应用提供了更自然的交互方式。
- 交互方式更加多样和直观,用户体验进一步提升。
-
人工智能和机器学习阶段(当前及未来):
- 人工智能(AI)和机器学习(ML)技术的融合,使得系统能够理解和预测用户行为。
- 个性化推荐、智能客服、自动驾驶等应用不断涌现。
- 人机交互更加智能化,系统能够在更大程度上理解和适应用户需求。
Q:注意有什么功能
A:注意是作为认知过程的一部分,通常是指选择性注意,即注意是有选择的加工某些刺激而忽视其他刺激的倾向。它是人的感觉(视觉、听觉、味觉等)和知觉(意识、思维等)同时对一定对象的选择指向和集中(对其他因素的的排除)。
Q:立体眼镜有哪几种,详细介绍一种的原理
A:立体眼镜主要用于观看立体电影或 3D 图像,通过不同的方式将左右眼看到的图像分离,从而产生立体效果。常见的立体眼镜有以下几种:
-
红蓝(或红绿、红青)立体眼镜:
- 这种眼镜使用红色和蓝色(或其他颜色)滤光片来分离左右眼的图像。
- 通常用于早期的 3D 电影和一些 3D 印刷材料。
-
偏振立体眼镜:
- 使用偏振滤光片来分离左右眼的图像。
- 常用于电影院的 3D 电影放映,如 IMAX 3D。
-
主动快门立体眼镜:
- 使用电子快门技术,通过快速交替遮挡左右眼来分离图像。
- 常用于家庭 3D 电视和一些高端 3D 显示设备。
-
分时立体眼镜:
- 利用时间分割技术,通过快速切换左右眼的图像来实现立体效果。
- 这种技术通常需要专门的显示设备和眼镜配合使用。
-
光栅立体眼镜:
- 使用微小的光栅或柱状透镜来分离左右眼的图像。
- 这种技术常用于裸眼 3D 显示器,但也有光栅眼镜的版本。
下面详细介绍偏振立体眼镜的原理:
偏振立体眼镜利用光的偏振特性来分离左右眼的图像。具体如下:
-
偏振光的基本概念:
- 光是一种电磁波,具有电场和磁场的振动方向。
- 自然光的振动方向是随机的,而偏振光的振动方向是固定的。
- 偏振光可以通过特定的滤光片(偏振片)来产生。
-
偏振滤光片:
- 偏振滤光片只允许特定方向的光波通过,而阻挡其他方向的光波。
- 例如,一个垂直偏振片只允许垂直方向振动的光通过,而阻挡水平方向振动的光。
-
偏振立体眼镜的工作原理:
- 在 3D 电影放映过程中,使用两台投影机或一台投影机配合特殊的偏振镜头来投射两幅图像,一幅图像为左眼观看,另一幅图像为右眼观看。
- 左眼图像通过一个偏振方向(例如垂直偏振),右眼图像通过另一个偏振方向(例如水平偏振或 45 度偏振)。
- 观众佩戴的偏振立体眼镜有两个偏振滤光片,左眼滤光片与左眼图像的偏振方向一致,右眼滤光片与右眼图像的偏振方向一致。
- 这样,左眼只能看到左眼图像,右眼只能看到右眼图像,左右眼看到的不同图像在大脑中融合,产生立体效果。
优点:
- 偏振立体眼镜轻便且价格低廉。
- 无需电池或电子元件,使用方便。
- 适合大规模观众使用,如电影院。
缺点:
- 需要专门的偏振投影设备和银幕。
- 视角和头部倾斜度有限制,超过一定角度会影响立体效果。
- 偏振光的效率可能受到环境光线的影响。
偏振立体眼镜因其简单有效的原理和较低的成本,广泛应用于电影院和一些 3D 展示场合。
Q:介绍 RGB 模型,并列举两个使用该模型的交互设备
A:RGB 模型是一种颜色表示模型,基于红色(Red)、绿色(Green)和蓝色(Blue)三种基本颜色,通过不同强度的组合来生成各种颜色。RGB 模型广泛应用于各种显示设备和数字图像处理领域。
-
基本原理:
- RGB 模型使用加色法,通过混合红、绿、蓝三种基本色光来生成其他颜色。
- 每种颜色的强度通常用 0 到 255 的范围表示(在 8 位色深的情况下),也可以用 0.0 到 1.0 的浮点数表示。
- 当红、绿、蓝三种颜色的强度都为 0 时,产生黑色;当三种颜色的强度都为最大值时,产生白色。
-
颜色表示:
- 一个颜色可以表示为一个三元组(R, G, B),例如纯红色表示为(255, 0, 0),纯绿色表示为(0, 255, 0),纯蓝色表示为(0, 0, 255)。
- 中间的颜色通过不同强度的红、绿、蓝组合来表示,例如黄色可以表示为(255, 255, 0)。
使用 RGB 模型的交互设备:
-
计算机显示器:
- 描述:计算机显示器使用 RGB 模型来呈现图像和视频。每个像素由红、绿、蓝三个子像素组成,通过调节各子像素的亮度来显示不同的颜色。
- 工作原理:显示器的每个像素点包含红、绿、蓝三个子像素,通过电流控制各子像素的亮度来生成不同的颜色。显示器的分辨率决定了屏幕上能显示的像素数量。
- 应用:广泛用于个人电脑、笔记本电脑、平板电脑等设备,提供高分辨率和高色彩还原度的显示效果。
-
智能手机屏幕:
- 描述:智能手机屏幕也是基于 RGB 模型来显示图像和视频。现代智能手机屏幕通常采用 LCD 或 OLED 技术,每个像素点包含红、绿、蓝三个子像素。
- 工作原理:LCD 屏幕通过背光源和液晶层调节光的通过方式来显示颜色,而 OLED 屏幕则通过有机发光二极管直接发光,每个子像素单独控制亮度。
- 应用:智能手机屏幕提供高分辨率、多点触控和丰富的色彩表现,广泛应用于日常通信、娱乐、办公等领域。
Q:VR 界面设计的原则
A:虚拟现实(VR)界面设计需要考虑用户在沉浸式环境中的独特需求和交互方式。以下是一些关键的 VR 界面设计原则:
- 用户舒适度
- 减少晕动症:避免快速或突然的运动,尽量使用自然的移动方式,如步行或传送。
- 稳定的视角:保持用户视角的稳定,减少视角变化带来的不适。
- 合适的帧率:确保高帧率(通常至少 90 帧每秒),以提供流畅的视觉体验。
- 直观的交互
- 自然的交互方式:利用手势、语音或眼动追踪等自然的交互方式,减少学习成本。
- 一致的反馈:提供即时且一致的反馈,让用户知道他们的操作是否成功。
- 空间布局
- 3D 界面设计:充分利用三维空间进行界面设计,避免过于平面的设计。
- 重要信息的放置:将重要信息放置在用户视野的中心区域,减少头部和眼睛的移动。
- 可达性和可用性
- 易于访问的控件:确保交互控件易于访问和使用,避免复杂的操作步骤。
- 多样化的输入方式:支持多种输入方式,如手柄、手势、语音等,以适应不同用户的需求。
- 视觉和听觉设计
- 高对比度和清晰度:使用高对比度和清晰的视觉元素,确保在各种光照条件下都能看清。
- 适度的声音反馈:使用适度的声音反馈来增强沉浸感,但避免过度使用,以免干扰用户。
- 导航和指引
- 清晰的导航指引:提供清晰的导航指引,帮助用户在虚拟环境中找到方向。
- 标记和路径:使用标记和路径指引用户,避免迷失在虚拟世界中。
- 交互范围和舒适区
- 交互范围:设计交互范围在用户舒适区内,避免过度伸展或不自然的姿势。
- 动态调整:根据用户的姿势和位置动态调整界面元素的位置,保持舒适的交互距离。
- 适应性设计
- 用户个性化设置:允许用户根据个人喜好调整界面设置,如缩放、颜色、对比度等。
- 设备兼容性:确保界面设计在不同 VR 设备上都有良好的兼容性和表现。
- 安全性
- 虚拟边界:设置虚拟边界提醒用户避免撞到现实中的物体。
- 紧急退出:提供紧急退出机制,让用户在遇到不适或紧急情况时能迅速退出虚拟环境。
- 测试和迭代
- 用户测试:进行广泛的用户测试,收集反馈并不断改进界面设计。
- 迭代优化:根据用户反馈和测试结果进行迭代优化,确保界面设计的实用性和用户体验。
二、叙述题
Q:格式塔完整心理学有哪些原则,分别介绍
A:格式塔心理学(Gestalt Psychology)是一种心理学流派,强调人们在感知和认知过程中倾向于把零散的感知信息组织成有意义的整体。格式塔心理学提出了一些基本原则,这些原则解释了人们如何感知和组织视觉信息。以下是格式塔心理学的主要原则及其介绍:
- 整体性原则(Principle of Totality)
- 描述:人们倾向于整体地看待视觉信息,而不是孤立地看待各个部分。整体的感知效果往往不同于各个部分的简单相加。
- 应用:在设计中,整体布局和设计风格的统一性能够增强视觉效果。
- 相似性原则(Principle of Similarity)
- 描述:相似的元素被视为一个整体或群组。相似性可以基于颜色、形状、大小、纹理等特征。
- 应用:在界面设计中,可以通过相似的颜色或形状来组织和分类信息,使用户更容易理解和导航。
- 接近性原则(Principle of Proximity)
- 描述:彼此接近的元素被视为一个整体或群组。距离越近,越容易被看作一组。
- 应用:在布局设计中,相关的元素应放置在一起,以便用户自然地将它们视为一个整体。
- 连续性原则(Principle of Continuity)
- 描述:人们倾向于沿着平滑的路径或曲线来感知连续的形状和线条,而不是分离的碎片。
- 应用:在设计中,使用连续的线条和路径可以引导用户的视线,增强视觉流动性。
- 封闭性原则(Principle of Closure)
- 描述:人们倾向于填补不完整的图形或形状,使其成为一个完整的整体。这种心理倾向使得我们能看到完整的形状,即便它们是不完整的。
- 应用:在图形设计中,利用不完整的形状或边界可以创造出视觉上的趣味性和吸引力。
- 对称性原则(Principle of Symmetry)
- 描述:对称的元素被视为一个整体。对称性使得视觉信息更容易被组织和理解。
- 应用:在设计中,使用对称的布局和图形可以增加视觉的平衡感和美观性。
- 共同命运原则(Principle of Common Fate)
- 描述:以相同方式移动或变化的元素被视为一个整体或群组。运动的方向和速度相同的元素被看作是相关的。
- 应用:在动画设计中,利用共同的运动模式可以增强元素之间的关联性。
- 区域原则(Principle of Region)
- 描述:在视觉上被封闭或包围在一起的区域被视为一个整体。
- 应用:在界面设计中,使用边框或背景色块来分隔和组织不同的内容区域。
- 图形-背景原则(Figure-Ground Principle)
- 描述:人们倾向于将视觉场景分为图形(前景)和背景。图形是主要的视觉焦点,而背景则是次要的。
- 应用:在设计中,明确区分图形和背景可以增强视觉层次和焦点,使用户更容易关注重要信息。
通过理解和应用这些格式塔原则,设计师可以创建更具组织性和美观性的视觉设计,提高用户的感知和理解效率。这些原则不仅适用于视觉设计,还可以应用于其他领域,如用户界面设计、产品设计和信息架构等。
Q:图形用户界面的基本交互任务
A:图形用户界面(GUI)的基本交互任务包括以下几个方面:
- 指向和选择
- 指向:用户使用输入设备(如鼠标、触摸屏)将光标移动到屏幕上的某个图标或控件上。
- 选择:用户通过点击、触摸或其他操作方式选择目标对象,使其成为后续操作的焦点。
- 拖放
- 拖动:用户按住鼠标按钮或触摸屏,将对象从一个位置拖动到另一个位置。
- 放置:将对象放置在目标位置,通常用于文件管理、图形编辑等操作。
- 菜单导航
- 打开菜单:点击或触摸菜单栏,显示下拉菜单或上下文菜单。
- 选择菜单项:在菜单中选择某个选项以执行特定命令或打开子菜单。
- 窗口管理
- 打开和关闭窗口:启动或关闭应用程序窗口。
- 移动窗口:拖动窗口标题栏,将窗口移动到屏幕的不同位置。
- 调整窗口大小:拖动窗口边缘或角落,改变窗口大小。
- 最小化、最大化和还原:最小化窗口到任务栏、最大化窗口以占满屏幕或还原窗口到之前的大小。
- 文本输入和编辑
- 光标定位:点击文本框或文档中的某个位置,将光标定位到该处。
- 文本输入:使用键盘输入字符、数字和符号。
- 文本选择:通过点击和拖动选择一段文本,以便进行复制、剪切或格式化操作。
- 文本编辑:执行复制、剪切、粘贴、删除和格式化等操作。
- 表单交互
- 填写表单:在表单控件(如文本框、下拉菜单、复选框、单选按钮等)中输入或选择数据。
- 提交表单:点击提交按钮,将表单数据发送到后台处理。
- 滚动和翻页
- 滚动:使用滚动条、鼠标滚轮或触摸手势,在内容较多的窗口或页面中上下或左右滚动。
- 翻页:在多页内容中,通过点击分页按钮或滑动手势翻页。
- 工具栏和快捷方式
- 工具栏操作:点击工具栏上的按钮,快速执行常用命令。
- 快捷键:使用键盘快捷键,快速执行特定操作。
- 对话框交互
- 打开对话框:执行某个操作时,弹出对话框以获取用户输入或确认操作。
- 填写和确认:在对话框中输入数据或选择选项,然后点击确认或取消按钮。
- 状态和反馈
- 状态栏:查看应用程序的状态信息,如进度、错误消息等。
- 通知和提示:接收系统或应用程序的通知和提示信息,了解当前操作状态或需要采取的行动。
Q:列举三个你在元宇宙中可能的交互情景
A:元宇宙(Metaverse)是一个虚拟的共享空间,通过增强现实(AR)、虚拟现实(VR)、区块链和其他前沿技术构建而成。在元宇宙中,用户可以以虚拟身份进行各种交互和活动。以下是三个可能的交互情景:
虚拟会议和协作
场景描述:
你戴上 VR 头显,进入一个虚拟会议室,与来自世界各地的同事或合作伙伴进行实时沟通和协作。每个人都有一个虚拟化身,可以看到彼此的动作和表情。
交互细节:
- 进入会议室:通过选择日历上的会议,点击进入虚拟会议室。
- 交流与展示:使用虚拟白板进行演示,拖放虚拟文件进行分享,使用手势或语音进行讨论和互动。
- 协作工具:利用虚拟工具进行实时协作,如 3D 模型的共同编辑、虚拟文档的协作编写等。
- 反馈与记录:在虚拟白板上做笔记,自动记录会议内容,并在会后生成会议纪要。
虚拟购物体验
场景描述:
你进入一个虚拟购物中心,可以自由浏览各个商店,试穿衣物、试戴配饰,甚至可以和虚拟店员互动,获得推荐和建议。
交互细节:
- 浏览商品:通过手势或眼动控制在虚拟商店中移动,查看商品展示。
- 试穿试戴:选择商品后,虚拟化身会自动试穿或试戴,用户可以通过镜子看到效果。
- 互动咨询:与虚拟店员进行对话,获取商品信息、优惠活动和推荐。
- 支付与结算:通过虚拟支付系统完成购买,选择虚拟物品的配送方式(虚拟物品直接添加到用户账户,实物商品配送到现实地址)。
虚拟社交和娱乐
场景描述:
你和朋友们相约在一个虚拟娱乐场所,如一个虚拟俱乐部、音乐会或游戏世界,共同享受娱乐活动和社交互动。
交互细节:
- 进入场所:通过选择活动或场所,点击进入虚拟娱乐场所。
- 互动和交流:使用语音聊天、表情和手势与朋友互动,参加虚拟活动,如跳舞、玩游戏等。
- 参与娱乐活动:在虚拟音乐会上,观看虚拟演出,互动灯光和特效,甚至可以与虚拟艺人互动。
- 分享和记录:拍摄虚拟合影,录制虚拟视频,并分享到虚拟社交平台或现实中的社交媒体。
在元宇宙中,用户的交互体验将更加沉浸和多样化。无论是工作、购物还是娱乐,元宇宙提供了一个全新的平台,让用户能够以更加直观和互动的方式进行各种活动。这些交互情景不仅丰富了用户的虚拟生活,也为现实生活提供了更多的便利和乐趣。
三、综合题
我设计了一个我校手机端学校网站
- 这个交互范式中的 5w + h 是什么
- 预计使用手机的什么输入和输出
- 对网站系统评估的方法和步骤
答:设计一个手机端学校网站涉及多个方面的考虑,包括交互范式、输入输出方式以及系统评估的方法和步骤。以下是详细的回答:
交互范式中的 5W + H
5W + H 是一个常用的分析框架,用于全面理解和设计系统。具体来说:
-
Who(谁):
- 用户群体:学生、教师、家长、校友和行政人员。
- 用户需求:获取学校新闻、查看课程安排、提交作业、查看成绩、联系教师、获取学校活动信息等。
-
What(什么):
- 功能和内容:新闻公告、课程表、成绩查询、在线作业提交、班级通知、校园活动、校历、校园地图、教师联系方式、图书馆资源、在线缴费等。
-
When(何时):
- 使用场景:在校期间、课间休息、放学后、周末、假期、紧急通知时等。
- 频率:日常使用、每学期初和期末频繁使用、特定事件或活动期间使用。
-
Where(何地):
- 使用环境:在校园内、在家、在公共交通工具上、在图书馆等。
- 设备:主要通过智能手机访问,可能在不同网络环境(Wi-Fi、移动数据)下使用。
-
Why(为什么):
- 目的:方便用户获取学校相关信息、提高沟通效率、提供便捷的在线服务、增强学校与用户的互动和联系。
-
How(如何):
- 交互方式:通过触摸屏进行导航和操作,使用直观的用户界面设计,提供清晰的导航栏和快捷访问功能。
预计使用手机的输入和输出
输入方式:
- 触摸屏:点击、滑动、长按、双击等手势操作。
- 虚拟键盘:输入文本,如搜索、填写表单、发送消息等。
- 语音输入:通过语音助手进行搜索或命令输入。
- 摄像头:扫描二维码、拍摄照片上传(如提交作业或活动照片)。
- 传感器:利用加速度计、陀螺仪进行特定手势操作或增强现实功能。
输出方式:
- 屏幕显示:高分辨率显示文本、图片、视频等内容。
- 通知:推送通知提醒重要事件、公告、紧急信息等。
- 声音:语音提示、通知音效、视频播放等。
- 振动:触觉反馈,如收到重要通知时的振动提醒。
对网站系统评估的方法和步骤
方法:
-
用户测试(Usability Testing):
- 目标:评估用户在使用网站时的体验和问题。
- 步骤:
- 招募代表性用户群体(学生、教师、家长等)。
- 设计具体的测试任务(如查找课程表、提交作业)。
- 观察并记录用户完成任务的过程,收集反馈。
- 分析数据,识别常见问题和用户痛点。
-
问卷调查(Surveys and Questionnaires):
- 目标:收集用户对网站功能和界面设计的满意度和建议。
- 步骤:
- 设计问卷,涵盖使用频率、满意度、功能需求等方面。
- 通过线上或线下渠道分发问卷。
- 收集并分析问卷数据,提取用户需求和改进建议。
-
分析用户行为数据(User Analytics):
- 目标:通过数据分析了解用户行为和使用模式。
- 步骤:
- 部署分析工具(如 Google Analytics)。
- 收集数据(如页面访问量、点击率、停留时间)。
- 分析数据,识别高频访问页面、用户流失点等。
- 基于数据优化网站结构和内容。
-
专家评估(Expert Review):
- 目标:通过专家对网站进行评估和改进建议。
- 步骤:
- 邀请 UI/UX 设计专家、教育技术专家进行评审。
- 提供网站访问权限和评估标准。
- 收集专家反馈,进行改进。
步骤:
-
制定评估计划:
-
实施评估:
-
分析结果:
-
制定改进方案:
-
实施改进:
-
重新评估:
通过以上方法和步骤,可以全面评估和优化手机端学校网站,提升用户体验和系统性能。

- Human 人
- 用户是与计算机系统交互的个人或一组个人。用户有特定的目标、需求、偏好和能力来驱动他们与系统的交互。
- 人的因素是交互计算机系统的物质基础,与用户的各种特征有关。
- 如:人有弱点:操作可能会出错;对计算机知识的掌握程度不同;用户年龄、文化层次、工作经历及职业不同,对操作使用的要求也不同。
- Computer 交互设备
- 交互设备构成了人机对话的基础,没有这些设备就无法让计算机了解用户的意图。
- 图形、图像输入输出设备,声音、姿势、触觉设备,三维交互设备等,而且这些交互设备也在不断的完善中,使得在交互过程中达到最佳的状态和效果。
- Interaction 交互
- 交互是人机交互系统的核心,向用户提供各种交互功能,以满足系统预定的要求。
- 交互设计对于塑造用户的技术体验至关重要,确保它是高效、直观的,并与用户的目标和期望保持一致。
个人觉得应该非常重要。
人机交互从技术上讲(狭义的),主要是研究人与计算机之间的信息交换,它主要包括人到计算机和计算机到人的信息交换两部分:
- 人们如何借助键盘、鼠标、操纵杆、眼动跟踪器、位置跟踪器、数据手套、压力笔等(输入设备),用手、脚、声音、姿势或动作、眼睛甚至脑电波等向计算机传递信息(输入方式);
- 计算机如何通过打印机、显示器、头盔式显示器(HMD)、音响、力反馈等(输出设备)给人提供信息。
人机交互是关于设计、评价和实现供人们使用的交互式计算机系统,且围绕这些方面的主要现象进行研究的学科。
广义上讲,人机交互以实现自然、高效、和谐的人机关系为目的,与之相关的理论和技术都在其研究范畴,是计算机科学、心理学、认知科学以及社会学等学科的交叉学科。
研究开发新的人机交互设备、技术和理论,以实现无处不在计(ubiquitous computing)环境下的以用户为中心的交互式计算机系统,使其能够增强人的创造力,解放人类的大脑、改善人与人之间的交流与协作。
用户中心设计(User-Centered Design,UCD)的原则有:
- 明确且理解用户、任务和场景
- 用户需求参与设计和开发过程
- 由 UCD 来评估驱动和完善设计
- 不断迭代
- 完善了产品的用户体验
- 设计团队能提供多学科维度的观点
可行性工程:
人机交互与认知心理学、社会学、人机工程学、多媒体技术和虚拟现实等技术密切相关。
认知心理学、社会学与人机工程学是人机交互技术的理论基础,而多媒体技术、虚拟现实、人工智能技术与人机交互技术相互交叉和渗透。

人机交互的研究内容涵盖了建模、设计、评估等理论和方法,以及在 Web、移动计算、虚拟和增强现实等方面的交互技术。
研究问题包含:
- Model and Methodology 人机交互界面表示模型与设计方法
- Web-Interaction Web 设计
- Mobile and Ubicomp 移动界面设计
- Intelligent User Interface 认知与智能用户界面
- Usability and Evaluation 可用性分析与评估
- Multi-Modal 多通道交互技术
- Interaction for VR/AR 虚拟和增强环境中的交互方法
- Groupware 群件、人机协同
友好人机交互界面的开发离不开好的交互模型与设计方法:行为模型;结构模型;模型转换;表现模型
-
行为模型:行为模型描述了用户与界面之间的交互行为,包括用户如何与界面进行交互、系统如何响应用户操作等。行为模型帮助设计者了解用户的需求和期望,从而设计出更符合用户习惯和预期的界面。
-
结构模型:结构模型描述了界面的组织结构,包括界面元素之间的关系、布局等。结构模型帮助设计者设计出清晰、易于理解和导航的界面结构,使用户能够快速找到需要的信息或功能。
-
模型转换:模型转换指的是将行为模型和结构模型转化为实际的界面设计。这涉及将抽象的概念转化为具体的界面元素、布局和交互方式,确保设计符合用户需求和设计目标。
-
表现模型:表现模型描述了界面的外观和样式,包括颜色、字体、图标等视觉元素。表现模型帮助设计者设计出美观、一致的界面外观,提升用户体验和界面的吸引力。
Web 设计
可以将 Web 理解为一个用户与其他用户之间通过 Internet 进行信息交流的抽象界面。Web 界面设计可以看作是人机交互界面设计的一个应用与延伸。
重点研究 Web 界面的信息交互模型和结构,Web 界面设计的基本思想和原则,Web 界面设计的工具和技术,以及 Web 界面设计的可用性分析与评估方法等内容。
移动界面设计
移动计算(Mobile Computing)、无处不在计算(Ubiquitous Computing)等对人机交互技术提出了更高的要求,面向移动应用的界面设计问题已成为人机交互技术研究的一个重要应用领域。
针对移动设备的便携性、位置不固定性和计算能力有限性以及无线网络的低带宽高延迟等诸多的限制。研究移动界面的设计方法,移动界面可用性与评估原则,移动界面导航技术,以及移动界面的实现技术和开发工具,是当前的人机交互技术的研究热点之一。
可用性分析与评估
可用性是人机交互系统的重要内容,它关系到人机交互能否达到用户期待的目标,以及实现这一目标的效率与便捷性。
人机交互系统的可用性分析与评估的研究主要涉及到支持可用性的设计原则和可用性的评估方法等。
多通道交互技术
多通道交互(Multi Modal Interaction,MMI)是指一种使用多种通道与计算机通信的人机交互方式。
指用户使用语音、手势、眼神、表情等多种方式与计算机系统进行通信。主要研究多通道交互界面的表示模型、评估方法以及多通道信息的融合等。其中,多通道信息整合是多通道用户界面研究的重难点。
所谓的通道(modality)涵盖了用户表达意图、执行动作或感知反馈信息的各种通信方法,如言语、眼神、脸部表情、手势、头动、肢体姿势、触觉、嗅觉或味觉等”。
多通道交互就是综合使用多种输入通道和输出通道,用最恰当的方式传递服务,满足用户需求。

如果问“多通道交互的例子”,那么可以用类似的智能助手作答,只要包含多个通道的解释说明(比如声音啦,视觉啦,当然要区分输入通道和输出通道)即可。
认知与智能用户界面
即 Intelligent User Interface,IUI。智能用户界面的最终目标是使人机交互和人-人交互一样自然、方便。
上下文感知、眼动跟踪、手势识别、三维输入、语音识别、表情识别、手写识别、自然语言理解等都是认知与智能用户界面需要解决的重要问题。
又比如智能家居云云。
虚拟和增强环境中的交互方法
“以人为本”的、自然和谐的人机交互理论和方法是虚拟现实的主要研究内容之一。
通过研究视觉、听觉、触觉等多通道信息融合的理论和方法、协同交互技术以及三维交互技术等,建立具有高度真实感的虚拟环境,使人产生“身临其境”的感觉。
混合现实(Mixed Reality,MR)从现实到虚拟的程度,可有:现实环境(Real Environment) - 增强现实(Augmented Reality,AR) - 增强虚拟(Augmented Virtuality,AV) - 虚拟环境(Virtual Environment)。
所谓增强现实(AR),即将计算机生成的虚拟物体或其它信息叠加到真实场景中,从而实现对现实的“增强”。
群件
群件是指帮助群组协同工作的计算机支持的协作环境,主要涉及个人或群组间的信息传递、群组中的信息共享、业务过程自动化与协调,以及人和过程之间的交互活动等。
以计算机网络技术为基础,以交流、协调、合作及信息共享为目标,支持群体协同工作需要的应用软件。它允许个人和小组成员间进行有效的协同工作而不管他们的地理位置如何。
说白了就是多人协同。例子就想像多人一起编辑腾讯云文档。
目前与人机交互技术相关的研究主要包括:
- 群件系统的体系结构
- 计算机支持交流与共享信息的方式
- 交流中的决策支持工具
- 应用程序共享
- 同步实现方法
Q:思考并描述一个应用场景,展示人机交互在实际中是如何运作的?解释其中涉及的人机交互的要素等。(问的是实际应用场景)
A:设想一个医疗领域的应用场景。在一家医院,医生使用一款虚拟现实辅助手术系统来进行复杂手术操作。这个系统通过虚拟现实技术提供了高度精确的手术模拟和导航,帮助医生在手术过程中更加准确地定位和操作。
人机交互的要素:
- 用户:在这个场景中,医生是用户。他们通过虚拟现实头戴设备等设备与系统进行交互。医生的专业知识和技能对于操作系统和进行手术至关重要。
- 交互设备:医生使用虚拟现实头戴设备来进入虚拟手术环境。这些设备提供了医生与系统进行信息交换的媒介。
- 交互设计:医生通过手势等方式来进行操作,例如定位器、切割工具等。系统会根据医生的操作提供实时的视觉反馈,帮助医生调整操作并完成手术。
在这个医疗应用场景中,人机交互的要素共同作用,帮助医生在手术过程中更加精准地操作,提高手术的成功率和患者的安全性。
人机交互的发展过程,是人适应计算机到计算机不断地适应人的发展过程。
几个阶段:命令行 -> 图形用户界面 -> 自然和谐的交互
第一代人机交互:语言命令交互阶段,是计算机和用户互动的早期阶段。主要特点是:
- 用户通过文本命令来控制计算机
- 这个阶段的用户界面非常基础,通常只包括一个文本终端或命令行界面,用户必须记住各种命令和参数。
命令行怎么你了?差不多得了,屁大点事都要拐上命令行,命令行一没招你惹你,二没干伤天害理的事情,到底怎么你了让你一直无脑抹黑,Linux 每天费尽心思的文化输出弘扬命令行文化,你这种喷子只会在网上敲键盘诋毁良心交互,Linux 的未来就是被你这种人毁掉的。
尽管在用户友好性方面存在一些限制,但它为用户提供了强大的控制权和自定义选项。这个阶段对于计算机领域的发展起到了重要作用,它为后来的图形用户界面和更高级的交互方式奠定了基础。
第二代人机交互:图形用户界面(GUI)交互阶段(1980 年代中期至今)。它使人机交互方式发生了巨大变化。
GUI 通过可视化元素如窗口、图标、菜单和按钮来呈现信息和操作。
图形用户界面(GUI)又称为 WIMP 界面,由窗口(window)、图标(icons)、菜单(menu)、指点设备(pointing device)四位一体,形成桌面(desktop)。GUI 的主要特点是桌面隐喻、“所见即所得”、直接操纵。
桌面隐喻的设计使计算机的文件管理变得更加可视化和用户友好。它让用户觉得他们在处理实际的物理文件一样,从而降低了使用计算机的学习曲线,使文件和文件夹的管理变得更容易理解和操作。
WIMP 界面的概念模型如下:

GUI 简明易学,减少了敲击键盘的次数,使得普通用户也可以熟练使用,从而拓展了用户群,使计算机得到了普及。缺点是用户只能使用手这一种输入通道,需要占用较多的屏幕空间,并且难以表达和支持非空间性的抽象信息的交互。
第三代人机交互:自然和谐的人机交互阶段
随着网络和无线通讯、虚拟现实、普适计算等技术的飞速发展,逐渐进入自然和谐的人机交互阶段:利用人的多种感觉通道和动作通道(语音、手写、姿势、视线、表情等输入),以并行、非精确的方式与计算机环境进行交互,使人们从传统的交互方式的束缚中解脱出来。
比如说,Siri 啦,S Pen 啦,之类的;还有什么动捕之类的。
自然和谐人机交互阶段主要研究内容包括多通道交互、情感计算、虚拟现实、智能用户界面、自然语言理解等方面。
情感计算是人机交互中的一个重要方面, 赋予信息系统情感智能, 使计算机能够“察言观色”,将极大提高计算机系统与用户之间的协同工作效率,而情感的感知和理解离不开人工智能方法的支撑。这个领域的发展使得计算机界面和交互变得更加智能、人性化和适应性强。
然后大说一通情感计算在自然和谐人机交互中怎么怎么有用了。问就是能识别(用户),能生成(模拟相应的情感),能响应(识别用户的情感以后当然要响应),能分析能反馈。
虚拟现实(Virtual Reality,VR)是以计算机技术为核心,结合相关科学技术,生成与一定范围真实环境在视、听、触感等方面高度近似的数字化环境,用户借助必要的装备与数字化环境中的对象进行交互作用、相互影响,可以产生临近真实环境的体验。
VR 的历史我觉得不需要看。
比较常见的 VR / AR 形式:
- VR
- VR 头盔、一体机:Oculus,HTC Vive 等
- 桌面式 VR:立体投影仪、3D 眼镜等
- CAVE:立体投影仪、3D 眼镜等
- 大型 MR 体验馆:大型弧幕、球幕、工程级高清投影,3D 眼镜等
- AR
- 移动式 AR:具有摄像头的智能手机、平板电脑
- AR / MR 头盔:HoloLens 等
GPT 介绍的 CAVE
CAVE系统是一种专门用于虚拟现实(Virtual Reality,VR)体验的环境。CAVE是Cave Automatic Virtual Environment的缩写,意为“自动洞穴虚拟环境”。它是一种多人参与的虚拟现实系统,旨在提供一种沉浸式的体验,让用户感觉好像置身于一个虚拟的三维环境中。
特点和工作原理:
- 结构:CAVE系统通常由三至六面的大型投影屏幕组成,这些屏幕围绕着用户,营造出一个封闭的虚拟环境。用户站在这个环境中央,可以360度全方位地观察虚拟世界。
- 投影:每个屏幕上都会投影出虚拟场景的一部分,通过立体视觉效果和逼真的图像,使用户感觉好像身临其境。
- 交互:用户通常会配备头戴式显示器或眼镜,以便在虚拟环境中看到图像。此外,用户还可以通过手柄、手势识别等设备与虚拟环境进行互动。
- 沉浸感:CAVE系统的设计旨在提供一种高度沉浸式的体验,让用户感觉好像真正置身于虚拟世界中,与虚拟对象进行互动和探索。
应用领域:
- 科学研究:CAVE系统在科学研究领域被广泛应用,例如模拟天体运行、分子结构的可视化等。
- 设计和工程:工程师和设计师可以使用CAVE系统来进行产品设计和模拟,以便更好地理解产品在实际使用中的表现。
- 医学:在医学领域,CAVE系统可以用于手术模拟、解剖学教学等方面。
总的来说,CAVE系统是一种高度沉浸式的虚拟现实环境,通过多面投影屏幕和交互设备,让用户沉浸在逼真的虚拟世界中,为各种领域的应用提供了强大的工具和体验。
自然语言处理(NLP,Natural Language Processing)是使用自然语言同计算机进行通讯的技术,因为处理自然语言的关键是要让计算机“理解”自然语言,所以自然语言处理又叫做自然语言理解,也称为计算语言学。
一方面它是语言信息处理的一个分支,另一方面它是人工智能的核心课题之一。
比较 AI 的部分就靠自己的 NLP 常识就够了。
这一 part 更是画饼。我觉得都没什么好看的。
人机共生的思想:希望在不久的将来,人脑与计算机器能够非常紧密地耦合在一起,所得到的合作关系将是能想到此前人类大脑之所未想,而对数据的处理则是我们今天所知的信息处理机器远不能及。
应用举例:残疾人骨骼增强。
- 冬奥里出现的各种科技
- 医疗:防疫过程中的机器人、无人机等
- 虚拟手术是利用各种医学影像数据,利用虚拟现实技术在计算机中建立一个模拟环境,医生借助虚拟环境中的信息进行手术计划、训练,以及实际手术过程中引导手术的新兴学科。
- 军事:仿真训练、驾驶培训、战术演习之类的
- 娱乐:游戏厅、展览馆等中采用的相关技术
- 影视:这里主要是指动捕
- 生活:例如,指纹识别和人脸表情识别技术广泛应用于人们日常生活的通信过程或者安全保护
- 文化:各类艺术形式,比如数字孪生那种,在虚拟世界中复现艺术作品
- 体育:转播方面,可以搞三维转播之类的;训练方面,可以帮助教练更好观察运动员的训练,从而获取各种指标数据,提供科学的指导,总结出科学的规律
- 工业:比如车内的人机交互系统;比如无人驾驶汽车等等
元宇宙( Metaverse )可以笼统的理解为一个平行于现实世界的虚拟世界,现实中人们可以做到的事,都可以在元宇宙中实现。
元宇宙是整合多种新技术而产生的新型虚实相融的互联网应用和社会形态。它基于扩展现实技术提供沉浸式体验,基于数字孪生技术生成现实世界的镜像,基于区块链技术搭建经济体系,将虚拟世界与现实世界在经济系统、社交系统、身份系统上密切融合,并且允许每个用户进行内容生产和世界编辑。
元宇宙集成了一大批现有技术,包括:5G、云计算、人工智能、虚拟现实、区块链、数字货币、物联网、人机交互等。
元宇宙四大核心技术:交互技术、通讯技术、计算能力、核心算法,彼此间互为补充
- 交互技术:VR/AR、全身追踪和全身传感等多维交互技术带来元宇宙的沉浸式交互体验。
- 通讯技术:5G、WiFi 6 等多种通讯技术提升传输速率、降低时延,实现虚拟现实融合和万物互联架构。
- 计算能力:作为数字经济时代生产力,其发展释放了 VR/AR 终端压力,提升续航,满足元宇宙的上云需求。
- 核心算法:推动元宇宙的渲染模式视频质量提升,Al 算法缩短数字创作时间,赋能虚拟化身等多层面产业发展。
评价为饼先画着。
- 现实版神笔⻢良 Wonder Painter
- 基于折纸的 MR Storytelling 系统
- HoloLens Kinect:手势识别、触控、实物交互
- 吹气交互:音频识别
- 融合用户创新设计的 VR 新模式:说白了就是用户自己画场景
- 人机协同:比如老年关怀机器人
基本定义:与认知心理学相比,人体工程学(Ergonomics)更多地从人本身和系统的角度出发,研究人机关系。它是人机界面学初期发展阶段的主要研究内容,并对人机界面学以后的发展产生了重大的影响。
从科学性和技术性角度看,人体工程学可以这样定义:人体工程学是研究“人 - 机 - 环境”系统中人、机、环境三大要素之间的关系,为解决系统中的人的效能、健康问题提供理论与方法的科学。
- 人:指操作者或使用者
- 机:泛指人操作或使用的物,可以是机器,也可以是用具、工具或设施、设备等
- 环境:指人、机所处的周围环境,如作业场所和空间、物理化学环境和社会环境等
- 人 - 机 - 环境系统:指由共处于同一时间和空间的人与其所使用的机以及它们所处的周围环境所构成的系统,简称人 - 机系统
举例:


- 研究人与机器之间的分工与配合
- 研究机具如何能更适合人的操作和使用,以提高人的工作效率,减轻人的疲劳和劳动强度
- 研究人机系统的工作环境对操作者的影响,用以改善工作环境
- 研究人机之间的界面,信息传递以及控制器和显示器的设计等
首先,说说人机分工。
例子就是使用医疗配送机器人,送药、送餐、回收被服和医疗垃圾等工作,减少医护人员与病人之间接触的频次,降低交叉感染病毒的风险。它体现的就是人体工程学中的“人机分工配合”。又比如工厂中,人与机器人配合干活的例子。
一般地,以下工作可由机器来完成:
- 枯燥、单调、笨重的作业
- 危险性大的作业或会影响人体健康的作业
- 高级运算、快速操作
- 可靠的、高精度的和程序固定的作业
相反,以下工作则由人来完成:
- 程序设计
- 意外事件处理
- 变化频繁的工作
- 探索性工作或需要做出决策的工作
分析和优化人类与机器之间的任务分工,以确保最佳的工作效率和工作流程。研究人机分工与配合有助于设计更高效的工作系统,提高生产力。
第二,研究机具如何能更适合人的操作和使用。研究机具如何能更适合人的操作和使用,以提高人的工作效率、减轻人的疲劳和劳动强度。
例如关心机具的:
可能会问“某物的设计和人体工程学的关系 / 哪里体现了人体工程学”,这个总之分点模仿 GPT 说话分析就行了。
例子如下。
Q:应该买个什么样大小的手机?
A:舒适性:手机的大小应该符合人手的尺寸和握持方式,以提供舒适的操作体验。过大或过小的手机可能会导致手部不适、疲劳和误操作。
操作性:手机的大小直接影响用户对屏幕上元素的触及和操作。太大的手机可能需要使用两只手才能操作,而太小的手机可能限制用户的精确度和速度。因此,设计合适大小的手机可以提高操作的便捷性和效率。
可携带性:手机作为随身携带的设备,其大小也影响着携带的便利性。过大的手机可能难以放入口袋或包中,而过小的手机可能在显示屏尺寸和功能方面受到限制。因此,找到适合个人需求的合适大小可以平衡可携带性和功能性。
可视性:手机的屏幕大小与可视性直接相关。较大的屏幕可以提供更好的视觉体验,但同时可能增加单手操作时的不便。因此,在手机设计中要权衡屏幕大小和操作性之间的关系。
综上所述,人机工程学在手机设计中考虑到舒适性、操作性、可携带性和可视性等因素,有助于确定合适大小的手机。不同人可能根据个人喜好和需求选择不同大小的手机。
大概就是这样。
反正呢,器物要和人(使用者)的各种因素相宜,而这就是现代人机工程学的基本思想和学术理论的简洁表述。
第三,研究人机系统的工作环境对操作者的影响。研究人机系统的工作环境对操作者的影响,用以改善工作环境,提高工作条件和员工的健康。比如:
- 工作台的高度
- 座椅的设计
- 对照明、噪音、温度和通风等因素的分析
然后我觉得给的例子全是 GPT 生成的(
照明控制
- 自然光源利用:最大程度地利用自然光源,如窗户和天窗,以减少对人工照明的依赖。
- 人体感应照明:使用感应器和定时器来控制照明系统。例如,在没有人员活动时,自动关闭照明,当有人进入区域时,自动打开照明。
- 可调光系统:使用可调光的灯具,员工可以根据需要调整照明水平,以适应不同的任务和活动。
噪音控制
- 隔音设计:采用隔音材料和隔音结构设计,以减少外部噪音对工作区域的影响。
- 噪音屏蔽:提供噪音屏蔽设备,如耳塞或耳机,以帮助员工降低噪音的影响。
- 噪音源控制:识别和控制工作场所内的噪音源,例如维护噪音生成设备或通过工程措施减少噪音。
温度控制
- 空调和加热系统:使用合适的加热和空调系统,以保持室内温度在舒适范围内。
- 个人温控设备:允许员工在一定程度上控制自己的工作区域温度,例如使用小型加热器或风扇。
- 维护和检查:定期维护加热和冷却设备,以确保其正常运行。
通风控制
- 通风系统:确保工作区域有良好的通风系统,以排除有害气体、气味和污染物。
- 新风系统:引入新鲜空气,以提供员工充足的氧气,减少二氧化碳积聚。
- 排气系统:将有害气体和粉尘排出工作区域,以维持空气质量。
第四,研究人机之间的界面,信息传递以及控制器和显示器的设计。
人体工程学研究如何设计这些界面,以使用户能够轻松理解和操作系统,提高用户体验。还包括了研究信息传递、图形用户界面、声音反馈等方面的设计。
部分领域进展:
-
用户体验设计(UX):UX 设计已经成为人体工程学的核心领域之一。研究人员和设计师致力于创建更直观、易于使用且满足用户需求的界面和应用程序。这包括研究用户行为、需求分析、原型设计和用户测试。
-
虚拟和增强现实界面:随着虚拟现实(VR)和增强现实(AR)技术的发展,人体工程学研究了这些新界面的设计和交互方式,以确保用户在虚拟环境中的舒适性和效率。
-
自然用户界面(NUI):自然用户界面设计强调了自然的、生物机制驱动的界面元素,如语音识别、手势控制和眼动跟踪。这些界面有助于提供更直观的交互体验。
-
人机交互设计工具:开发了各种工具和软件来帮助设计师更轻松地创建、测试和分析界面。这些工具包括可视化设计软件、用户测试平台和分析工具。
-
生物反馈技术:研究人员已经开始探索生物反馈技术,通过监测生理数据(如心率、皮肤电导、脑电图等)来改善界面和控制器设计。这有助于提高用户的情感状态和注意力。
-
智能界面和机器学习:引入人工智能和机器学习技术,以使界面能够自适应用户的需求和行为,从而提高用户体验。
-
多模态交互:研究人员越来越关注多模态交互,即通过多种感官通道(视觉、听觉、触觉等)实现交互。这有助于提供更丰富和沉浸式的用户体验。
-
可访问性设计:可访问性设计成为人体工程学的重要方面,以确保不同能力的用户都能够方便地访问和使用界面,信息传递和控制器。
从横向看,人机工程学是一门交叉学科,涉及心理学、生理学、解剖学、生物力学和工程学等。
- 研究人与机器之间的分工与配合
- 研究机具如何能更适合人的操作和使用,以提高人的工作效率,减轻人的疲劳和劳动强度
- 研究人机系统的工作环境对操作者的影响,用以改善工作环境
- 研究人机之间的界面,信息传递以及控制器和显示器的设计等
心理学:心理学在人体工程学中的应用主要涉及用户体验、认知心理学和人机交互。研究人员使用心理学原理来理解用户的认知过程、注意力、学习和记忆,以改善界面和控制器的设计,使其更符合用户的认知需求。研究内容 4
生理学:生理学研究人体的生理功能和反应。在人体工程学中,生理学用于了解用户在不同环境条件下的生理状态,例如心率、呼吸、肌肉活动等,以评估工作环境的安全性和舒适性。研究内容 3
解剖学:解剖学研究人体的结构和组织,包括骨骼、肌肉、关节等。人体工程学使用解剖学知识来设计合适的工作站、椅子、工具和设备,以适应不同人体尺寸和形态。研究内容 2
生物力学:生物力学研究生物体的机械性能,包括力、压力、应力和运动。在人体工程学中,生物力学帮助研究员理解人体在不同任务和环境下的生物力学特性,以优化工作站、工具和设备的设计,以减轻身体的负担和减少损伤风险。研究内容 2、3
工程学:工程学在人体工程学中扮演关键角色,特别是在设计工作站、交通工具、医疗设备和消费产品方面。工程师使用工程原理和技术来开发符合人体工程学原则的产品和系统。研究内容 2
人的活动空间尺度

大体上像这样,并不很想再截图了。
- 人体坐姿的活动空间
- 坐姿垂直伸手高度
- 虚拟按钮的位置、大小;手的可控范围、视阈
- 人体跪姿的活动空间
- 人体卧姿的活动空间
- 仰卧的活动空间
总之是考虑了人体尺寸数据,应用于设计之中。
- 人与电视的不同距离(以电视尺寸设计为例)
- 角度(以吊灯设计为例)
- 肘高(以椅子设计为例)
- 坐高;坐姿肩峰高;坐姿两肘间宽;臀宽(以座椅设计为例)
- 坐姿大腿厚度;腿弯高度(桌椅系统)
- 臀部至足尖长;臀部至膝盖长度(车内座位系统)
可能会出题分析一下生活中的人体工程学设计案例,我的评价是化身 GPT 一通胡扯就完了。例子可以举:人体工学鼠标、键盘、椅子,枕头等等。
Q:我们的感觉器官(感官)有哪些?
A:我们的感觉器官(感官)主要有视觉、听觉、嗅觉、味觉、触觉。
Q:这些感官是如何帮助我们与外界互动并认识世界的呢?
A:我们的感官通过接收外界的刺激并将其传递给大脑,帮助我们与外界互动并认识世界。每种感官都有特定的功能和作用,如下:
-
视觉:
- 工作原理:眼睛接收光线,通过角膜和晶状体聚焦在视网膜上。视网膜上的感光细胞(视锥细胞和视杆细胞)将光信号转换成电信号,通过视神经传递到大脑的视觉皮层。
- 作用:视觉帮助我们识别形状、颜色、距离和运动,提供关于环境的重要信息,辅助导航和避障。
-
听觉:
- 工作原理:耳朵接收声波,声波通过外耳道传到鼓膜,引起鼓膜振动。这些振动通过听小骨传递到内耳的耳蜗,耳蜗内的毛细胞将振动转化为电信号,通过听神经传递到大脑的听觉皮层。
- 作用:听觉帮助我们识别声音的来源、方向和性质,理解语言和音乐,并在没有视觉信息时提供环境线索。
-
嗅觉:
- 工作原理:鼻腔内的嗅觉感受器接触空气中的化学物质,产生电信号,通过嗅神经传递到大脑的嗅觉皮层。
- 作用:嗅觉帮助我们识别气味,检测危险(如烟雾或腐败食物),并增强味觉体验。
-
味觉:
- 工作原理:舌头上的味蕾感受不同的化学物质(甜、酸、苦、咸、鲜),将信息转化为电信号,通过味觉神经传递到大脑的味觉中心。
- 作用:味觉帮助我们评估食物的可食性和营养价值,避免有害物质的摄入,并提供愉悦的饮食体验。
-
触觉:
- 工作原理:皮肤上的触觉感受器感知压力、温度和痛觉,将信号转化为电信号,通过周围神经传递到脊髓和大脑的触觉皮层。
- 作用:触觉帮助我们感知物体的形状、质地和温度,保护我们免受伤害,并在社交互动中提供重要的身体接触反馈。
通过这些感官的协同工作,我们能够全面地感知和理解周围的环境,做出适当的反应和决策,从而有效地与外界互动。
事实上我觉得 PPT 上面解释这些 bullshit 非常无聊。
视觉感知可以分为两个阶段:
-
接收外部信息阶段
- 光线会进入眼睛,并经过角膜、晶状体和玻璃体等组织折射,最终在视网膜上形成倒置的图像。这个图像是视觉信息的起点。
- 这个阶段的任务是将外部光线和刺激转化为神经信号,这些信号将被传递到大脑的下一个阶段进行处理。
-
解释信息阶段
- 这个阶段涉及到大脑,特别是视觉皮层,它负责解释和处理从视觉感光细胞传入的神经信号。大脑会接收来自眼睛的神经信号,然后对这些信号进行复杂的分析和解释,以还原成正立的、有意义的视觉信息。
- 大脑会识别图像中的各种特征,如形状、颜色、运动和深度,并将这些特征整合在一起,以形成我们对物体和场景的认知。
关于生理机制我觉得没什么好说的。要是担心会考的话就看看 PPT 上的解释就行了。
听觉感知传递的信息仅次于视觉,是非常丰富和重要的,但在日常生活中往往被视觉感知所主导,因此有时会被低估或被忽视。
人的听觉参数:
- 人类能够听到频率在 20Hz~20kHz 之间的声音,其中在 1000Hz~4000Hz 范围内听觉的感受性最高。500Hz 以下和 5000Hz 以上的声音,强度很大时才能被听到。
- 响度超过 140dB(分贝)时,所引起的不再是听觉而是痛觉。
- 人可以辨认的语音频率范围是 260~5600Hz。
人的听觉感受性和年龄有关,随着年龄的增长,首先丧失对高频声音的听觉,对低频声音听觉逐渐丧失。
听觉的特点:
- 较短时间内处于强噪音环境中,会感到刺耳、耳鸣、不适,引起听觉迟钝。
- 声音高于人的听阈 10-15dB 时,会导致听觉不适现象,但离开噪声环境几分钟后,听觉可以完全恢复正常,这一现象称为听觉适应。
- 若较长时间处于噪声环境中,会明显影响听力。如果听阈提高 15dB,离开噪音环境,也需要几小时至几十小时后听力才能恢复,这种现象称为听觉疲劳,也是可恢复的。
听觉的属性:
声音可以由音调、响度和音色三个属性来描述。
- 音调与声波的频率有关,低频能产生低调的声音,高频能产生高调的声音。
- 响度指在频率一定的情况下声波的振幅。
- 音色与发声的材料有关,不同的乐器可以产生相同频率和振幅的声波,但音色不同。
声音掩蔽现象:一个声音由于同时起作用的其他声音的干扰而使听觉阈限上升,称为声音的掩蔽。例如,在一间安静的房屋内,我们可以听到闹钟的滴答声、电冰箱的马达声,而在人声嘈杂的室内,上面这些声音被掩蔽。
声音的掩蔽依赖于声音的频率、掩蔽音的强度、掩蔽音与被掩蔽音的间隔时间等。
- 与掩蔽音频率接近的声音,受到的掩蔽作用大;频率相差越远,受到的掩蔽作用就越小
- 低频掩蔽音对高频声音的掩蔽作用,大于高频掩蔽音对低频声音的掩蔽作用
- 掩蔽音强度提高,掩蔽作用也增加。当掩蔽音强度很小时,掩蔽作用覆盖的频率范围也较小;掩蔽音的强度增加,掩蔽作用覆盖的频率范围也增加
谢弗将声景中的声音划分为基调声(Keynote Sounds)、信号声(Signals)和标志声 (Sound Marks)三类。虚拟现实环境中的听觉内容也可以按照这种分类进行相应设计。
- 基调声:指现实世界中的背景环境声。
- 信号声:能够引起人们刻意倾听的前景声,是人与环境的一种重要的交互信息。
- 标志声:指“标志性的、有一定的文化含义的、独一无二的声音”。
在 VR 开发时,听觉内容的设计与制作要综合考虑基调声、信号声及标志声的运用与传达,三类声音的综合运用可以有效提高用户 VR 体验的真实感与沉浸感。
人耳不仅能听到声音,还能够判断声音的位置和方位。
单耳线索:单声道线索依赖于到达单个耳朵的声音来约束可能的声源集合。人凭一只耳朵,就能初步辨出声音的方向,从而对声音进行定位。
- 耳廓形状不对称产生的声音扭曲。这取决于声音到达的方向,尤其是仰角。虽然人们没有意识到这种扭曲,但听觉系统可用它来定位。
- 声音的波幅与距离的关系。对于熟悉的声音,感知到的声音波幅(响度)可帮助估计距离。熟悉度越高越能帮助对距离的判断。
- 频谱失真。声音的高频分量比低频分量衰减得更快,因此远距离声音会发生频谱失真。
- 声音混响。进入耳朵的混响可以提供强大的单声道线索,这种线索被称为回声定位,室内环境中会更加明显。
双耳线索:人脑识别声源的位置和方向,是利用了两耳听到的声音的混响时间差(Interaural Time Difference,ITD)和混响强度差(Interaural Level Difference,ILD)
- 混响时间差(ITD):ITD 是指声音从一个声源到达两只耳朵之间的时间差。当声源位于听众的一侧时,声音会先到达离声源较近的耳朵,然后再到达离声源较远的耳朵。这一时间差是大脑用来确定声源水平方向的关键信息。当声源位于听众前方或后方时,两只耳朵几乎同时接收到声音,ITD 接近于零。但当声源偏离中时,ITD 会增加,大脑通过比较这一时间差来确定声源的方向。
- 混响强度差(ILD):ILD 是指声音在传播过程中导致两只耳朵接收到声音的强度不同当声源位于听众的一侧时,接近声源的耳朵会接收到较大强度的声音,而远离声源的耳朵接收到较小强度的声音。这一强度差也是大脑用来确定声源水平方向的信息之一。不同于混响时间差 ITD,混响强度差 ILD 在声音源前后方时仍然存在,但在不同方向上有所变化。
- 为了配合人类的双耳听觉感知,音频产品常采用立体声模式,通过双通道录音并配合耳机进行双通道播放,使用户双耳听到的声音产生差异,由此产生出声音的立体感与层次感。
其他线索:其他一些线索也有助于声音定位。例如,由声源或头部移动引起外耳滤波效应的变化能显著改进对声音位置的判断。人耳听觉系统对声源的定位还与身体结构有关。人的身体会与声波交互,这也会影响声音质量。
应用——三维立体声:
通过频谱差异的分析,就可以得出声音在进入内耳之前在人体头部区域(如面部、肩部、外耳廓)的变化规律,即为“头部相关传递函数”,利用该函数对虚拟场景中的声音进行处理后,那么即使用户使用耳机收听,也能感觉到三维空间中的声音立体感和真实性。
指皮肤、黏膜等受外界刺激时所产生的感觉,分为触觉、痛觉、温觉及力觉等
触觉:对表面纹理、粗糙度等的感知。
力觉:感知一般是指皮肤深层的肌肉、肌腱和关节运动感受到的力量感和方向感,例如用户感受到的物体重力、方向力和阻力等。(力觉是三维力和三维力偶矩的综合)。
定义与反应内容
感觉(sensation):人脑对直接作用于感觉器官的客观事物的个别属性的反映。
知觉(perception):人脑对直接作用于感官的事物的整体认识,是一系列组织并解释外界客体和事件产生的感觉信息的加工过程。所以说知觉是对事物个别属性间的关系、联系、整体的反映。
生理机制
感觉(sensation):感觉的产生依赖于客观事物的 物理属性,相同的刺激会引起相同的感觉。感觉是单一分析器活动的结果。
知觉(perception):不仅依赖于客观事物的物理属性,还依赖于知觉者本身的特点,如知识经验、心理状态、个体特征,知觉是多种分析器(感受器、传入神经、皮层)协同活动对复杂刺激物或刺激物之间的关系进行分析综合的结果。
感觉是知觉产生的 基础,感觉是知觉的有机组成部分,是知觉产生的基本条件。
知觉是高于感觉的 心理活动,但并非是感觉的简单相加之总和。
知觉是感觉的 深入与发展。
特点:观察者角度发生变化
定义:人在复杂环境中,在某一瞬间,不可能对众多事物进行感知,而总是有选择地把某一事物作为知觉对象,与此同时把其他事物作为知觉背景,这就是选择性。
知觉对象与背景的关系:只有当刺激物之间存在某种差异时一部分的刺激才能成为知觉的对象另一部分成为知觉的背景,从而是知觉对象从背景中凸显出来。
知觉对象与注意的关系:当注意指向某种事物的时候,这种事物便成为知觉的对象,其他事物便成为知觉的背景。
特点:事物本身发生变化(人没变)
指人根据自己的知识经验把直接作用于感官的客观事物的多种属性整合为统一整体的组织加工过程。
格式塔心理学:当视野中出现不完整因素时,视觉系统倾向于把它们完整起来,形成比较简单、稳定、正规化的图形。
- 简单律(minimum):视野中具有简单结构的部分,容易组成图形
- 邻近律/相近性(proximity):距离上相近的物体容易被知觉组织在一起
- 相似律/相似性(similarity):凡物理属性(颜色、形状、纹理)相近的物体容易被组织在一起
- 连续律(continuity):倾向于把经历最小变化或最少阻断的直线或者圆滑曲线知觉为一个整体
- 闭合律(closure):人们倾向于将缺损的轮廓加以补充使知觉成为一个完整的封闭图形
- 对称律:在视野中,对称的部分容易组成整体图形
- 协变律 The Law of Common Fate:同一运动趋向的元素会被归在一起
特点:观察者发生变化(物没变)
人在知觉过程中,不是被动地把知觉对象的特点记下来,而是以过去的知识经验为依据,力求对知觉对象作出某种解释,使它具有一定的意义。
特点:观察的条件发生变化(人,物都没边)
当客观条件在一定范围内改变时,人的知觉映象在相当程度上却保持着它的稳定性,即知觉恒常性。
- 形状恒常性:对物体形状的知觉不因它在视网膜上投影的变化而变化,称为形状恒常性。
- 大小恒常性:指在一定范围内,个体对物体大小的知觉不完全随距离变化而变化,也不随视网膜上视像大小的变化,其知觉映象仍按实际大小知觉的特征
- 明度(或视亮度)恒常性:当照明条件改变时,人知觉到的物体相对明度保持不变的知觉特征
- 颜色恒常性:指有颜色的物体(熟悉的),当其表面颜色受到照明等条件的影响而改变时,个体对颜色的知觉不因色光改变而改变,趋于保持相对不变的知觉特征。
知觉恒常性是可影响的,影响知觉恒常性最重要的因素视觉线索,就是环境中的各种参照物。
D.A.Norman把它们划分为两个模式:
经验认知:基于经验、熟悉和自动化的认知模式。有效、轻松地观察、操作和响应周围的事件,它涉及对已有知识和技能的运用,要求具备某些专门知识并达到一定的熟练程度,如使用Word字处理系统编辑文档等。
思维认知:是一种更加理性和有意识的认知模式。涉及思考、比较和决策的活动,是发明创造的来源,包括对问题的分析、创新和解决方案的制定。如在设计创作过程中,我们需要进行大量的思考和分析,以找到最佳的设计方案。
是作为认知过程的一部分,通常是指选择性注意,即注意是有选择的加工某些刺激而忽视其他刺激的倾向。
注意两个基本特征:
- 指向性:指心理活动有选择的反映一些现象而离开其余对象
- 集中性:指心理活动停留在被选择对象上的强度或紧张
- 无意注意:也称不随意注意,无预定目的,不需意志努力
- 有意注意:也称随意注意,有预定目的,需要意志努力
- 有意后注意:对熟练或感兴趣的工作,有目的,意志努力程度低。
- 选择功能:注意的基本功能是对信息选择,使心理活动选择有意义的、符合需要的和与当前活动任务相一致的各种刺激;避开或抑制其他无意义的、附加的,干扰当前活动的各种刺激。
- 保持功能:外界信息输入后,每种信息单元必须通过注意才能得以保持,如果不加以注意,就会很快消失。因此,需要将注意对象的一项或多项内容保持在意识中,一直到完成任务,达到目的为止。
- 对活动的调节和监督功能:有意注意可以控制活动向着一定的目标和方向进行,使注意适当分配和适当转移。
-
注意的广度(对象的数目):也叫注意范围,是指一个人在同一时间里能清楚地把握对象的数量
-
注意的稳定性(时间):个体在较长时间内将注意集中在某一活动或对象上的特性。与注意的保持功能紧密相关。
- 内部条件: 个体的需要&兴趣
- 外部条件:活动内容的丰富性&形式的多样性
易混淆:注意的动摇
注意的动摇不同于持续性注意,它是指注意在短暂时间内的起伏波动(可能与不自主的眼球细微运动有关)
注意的分散:稳定性的反面,指注意离开了当前应当完成的任务而被无关的事物所吸引。
-
注意的分配(一心二用,活动的数目):个体在同一时间对两种或两种以上的刺激进行注意,或将注意分配到不同的活动中(所谓一心二用)
- 基本条件是:同时进行的活动只有一种是不熟悉的,其余活动都非常熟悉、甚至达到了自动化的程度。否则很难有效分配。
-
注意的转移(主动,由...到...):是个体根据新的任务,主动地把注意由一个对象转移到另一个对象上或由一种活动转移到另一种活动上。
变化探测 (change detection):我们能够对周围世界中出现的变化进行觉察、识别和定位
变化盲视:指观察者不能探测物体或情景所发生变化的现象。
注意这一过程主要与两个方面有关:目标和信息表示
注意特点对界面设计的要求
- 信息的显示应醒目:如使用彩色、下划线等进行强调。
- 避免在界面上安排过多的信息:尤其要谨慎使用色彩、声音和图像,过多地使用这类表示易导致界面混杂,分散用户的注意力。
- 界面要朴实:朴实的界面更容易使用
头脑中积累和保存个体经验的心理过程,也就是人脑对外界输入的信息进行编码、存储和提取的过程。
记忆过程中有三个环节:
-
识记(编码):相当于信息的输入和编码过程,也就是使不同感官输入的信息,经过编码而成为头脑可接受的形式;
-
保持(储存):相当于信息的贮存,即信息在头脑中被再加工整理,使其成为有序地组织结构,以便贮存;
-
再认和回忆(提取):再认和回忆相当于信息的提取,编码越完善、组织越有序,提取也就越容易,反之,提取越困难。
- 文本输入设备:
- 键盘:使用按键输入字符和命令。
- 手写输入:使用手写笔或触摸屏进行手写输入。
- 图像输入设备:
- 二维扫描仪:用于将纸质文档或图片转换成数字化形式。
- 数码摄像头:用于捕捉静态图像或实时视频。
- 三维图形输入设备:
- 三维扫描仪:用于捕捉物体的三维形状和结构。
- 运动捕捉:用于追踪人体或物体的运动,并将其转换为数字化数据。
- Kinect:通过深度感应器和摄像头等技术,实现对人体动作和姿态的识别与跟踪。
- 指点输入设备:
- 鼠标:通过移动光标和点击按钮来进行操作。
- 控制杆:用于飞行模拟器或游戏控制等需要精确操控的场景。
- 触摸屏:通过触摸屏幕上的虚拟按钮、滑动或手势操作来输入指令。
具体的就不是很想写了。
至于 Kinect,都什么年代,还在玩传统深度摄像头?
- 光栅显示器
- CRT(阴极射线管)、LCD(液晶显示)、等离子显示器
- 投影仪
- 打印机
- 3D打印机
- 语音输出设备
我觉得如果原理不知道的话,看看 PPT 留个印象就行了。
说说比较重要的投影仪。
投影仪,是一种可以将数字图像或视频投射到幕布上的设备。
投影仪的基本原理:
- 光学分色过程,将高亮度的白光光源分解为RGB三束光线,用于生成RGB三个位面的光学图像;
- 调制过程,即通过光阀器件,使RGB三束光线分别接受原始数字图像中RGB三个位面的调制,从而形成RGB三个位面的光学图像;
- 合成显示,将RGB三个位面的光学图像进行合成,并投射出去,完成数字图像到光学图像的转换。
投影仪的参数有:
- 亮度
- 分辨率
- 对比度
- 镜头
亮度是我们常说的5000流明、6000流明、12000流明等。显然,流明越高,亮度越亮。投影机的流明,指的是投影机发光的亮度,流明(LM)是光通量的单位,它表示单位时间辐射光能量的多少。实际测试投影机的亮度时,流明是计算出来的一个数值,也就是画面的照度值乘以面积,最终得出一个流明数值。
分辨率是指屏幕上显示的像素个数。这个我觉得是常识来着。具体的也没什么好说的。
对比度是最亮画面(可以理解为纯白色)和最暗画面(可以理解为纯黑色)的亮度比值,它反映显示系统能够呈现的动态范围和灰度层次。显然,比值越大,从黑到白的亮度对比度越强烈、灰度渐变层次越丰富,能够获得更锐利、更细腻的主观视觉感受,显示彩色图片时,能够获得鲜明艳丽的效果。
镜头是投影机光路中的最后一个环节,镜头做的好坏,光圈值能否做的最小,和亮度是有直接关系的。实际案例中经常碰到的情况是已知 投影机的长边、短边和投射距离,镜头的计算:镜头大小=投影距离/投影机的长边。很多场合标镜都不太适用,所以得换短焦镜头。
Q:单台投影机的投影面积有限,如何扩大投影范围,以便展示更大的投影画面?
A:要扩大单台投影机的投影范围,以展示更大的投影画面,可以采用多种方法和技术。以下是一些常见的方法:
- 使用超短焦投影仪
超短焦投影仪可以在距离屏幕很近的位置投射出大尺寸的图像。通过减少投影距离,可以在有限的空间内实现更大的投影画面。
优点:
适用于狭小空间:在距离屏幕很近的地方投射出大画面,适合教室、会议室等空间有限的场所。
减少阴影:由于投影仪靠近屏幕,减少了观众或演讲者在投影画面上产生的阴影。
- 镜头位移(Lens Shift)和缩放(Zoom)功能
一些投影仪配备了镜头位移和缩放功能,可以调整投影画面的大小和位置,而无需移动投影仪本身。
优点:
灵活调整:可以在不移动投影仪的情况下调整投影画面的大小和位置,适应不同的投影需求。
精确控制:通过镜头位移和缩放功能,可以精确控制投影画面的边界和位置。
- 使用广角镜头
为投影仪配备广角镜头,可以在较短的投影距离内实现更大的投影画面。
优点:
扩大投影范围:广角镜头可以增加投影画面的宽度和高度,适合需要大范围投影的场景。
适应性强:可以在不同的投影环境中使用,提供更大的投影灵活性。
- 多投影仪拼接(Edge Blending / Tiling)
使用多台投影仪拼接图像,以实现更大的投影画面。通过边缘融合技术,可以使多个投影画面无缝衔接,形成一个大画面。
实现方式:
投影仪排列:将多台投影仪排列在一起,投射到同一屏幕上。
边缘融合:使用专门的边缘融合软件或硬件设备,处理和校正图像,确保拼接处无缝衔接。
信号分配:通过视频分配器或矩阵切换器,将不同的信号源分配给各个投影仪。
优点:
大画面显示:可以实现超大尺寸的投影画面,适合大型活动、展览和演示。
高分辨率:通过多台投影仪的拼接,可以实现更高的分辨率和更细腻的图像质量。
- 使用投影屏幕和反射镜
通过使用特制的投影屏幕和反射镜,可以扩大投影范围。例如,使用弧形屏幕或反射镜,可以将投影画面扩展到更大的区域。
优点:
扩展投影范围:反射镜可以改变投影光线的路径,扩大投影画面的范围。
创意展示:适用于需要特殊投影效果的场景,如博物馆展示、艺术装置等。
投影仪的分类:
- CRT型投影仪
- LCD型投影仪(市场主流)
- DLP型投影仪(市场主流)
CRT型投影仪
通常所说的三枪投影仪就是由三个投影管组成的投影仪,由于使用内光源,也称主动式投影方式。
CRT投影仪可把输入信号源分解成R、G、B三个CRT管的荧光屏上,荧光粉在高压作用下发光系统放大、会聚,在大屏幕上显示出彩色图像。
工作原理:
- 光学分色:三枪投影仪使用一个光学系统(阴影掩膜)来将输入的白光分解为红、绿、蓝三个颜色通道的光线。阴影掩膜是一个具有非常小孔径的金属板或网格结构。它位于电子枪和荧光屏之间,用于分隔不同颜色的光束。
- 调制:在三枪投影仪中,每个颜色通道都有一个相应的电子枪,即红色电子枪、绿色电子枪和蓝色电子枪。这些电子枪通过发射聚焦的电子束来控制光线的亮度。通过调整电子束的强度,可以控制经过荫罩的光线的亮暗程度。
- 合成:调制后的红、绿、蓝三个位面的光线会再次汇合并进入一个光学系统,使红、绿、蓝三个位面的光线重叠在一起。通过合成,三个颜色通道的光线会混合形成一个完整的彩色图像。
优点:
-
色彩丰富和还原性好:由于CRT投影仪使用荧光屏发射光线,其能够产生广泛的色域和精确的颜色表现,从而呈现出丰富的色彩。此外,CRT技术可以更准确地还原输入信号中的细节和色彩信息。
-
无像素点和平滑过渡:CRT显示器没有像素点的概念,因此在播放视频时,图像的过渡更加平滑,不会出现明显的锯齿状边缘。这使得即使是分辨率相对较低的视频也能呈现较为自然的画面。
-
极致的黑位表现:CRT显示器具有主动发光的特点,这意味着它可以关闭电子枪来实现完全的黑色,从而实现出色的黑位表现。这样可以提供更高的对比度和更深沉的黑色,使图像更加生动逼真。
缺点:
- CRT投影仪的亮度值受限,目前在300流明以下。
- CRT投影仪操作复杂,特别是会聚调整繁琐,机身体积大,只适合安装于环境光较弱、相对固定的场所,不宜搬动。
LCD型投影仪
工作原理:
- 利用超高压水银灯作为投影光源,发出明亮的白光;经过光路系统中的分光镜,将白光分解为RGB三束光线;
- 3块液晶板上分别显示出数字图像RGB三个位面的图像,这时每一个液晶单元的作用类似于光阀门,控制每一个液晶单元中光线的透射率。
- RGB三束光线分别透过对应液晶面板,形成了RGB三个位面的光学图像。
- RGB三个位面的光学图像 通过合成棱镜合成为完整的彩色图像,投射到荧幕上。
-
光源和分光镜:LCD投影仪使用超高压水银灯作为光源,它发出明亮的白光。这些白光经过光路系统中的分光镜,将其分解为红色(R)、绿色(G)和蓝色(B)三束光线。
-
液晶板:液晶板是LCD投影仪的关键组件。液晶板上有三块,分别对应R、G、B三个颜色通道。每个液晶单元在作用电场的控制下,通过调节光线的透射率来控制对应颜色的光的强度。因此,每个液晶单元的作用类似于一个光阀门。
-
光学图像形成:R、G、B三束光线分别透过对应的液晶面板。根据输入信号,液晶单元会调节光线的透射率,只允许通过特定颜色的光线,从而形成了R、G、B三个位面的光学图像。
-
合成和投射:R、G、B三个位面的光学图像经过合成棱镜进行合成,形成一个完整的彩色图像。最后,这个彩色图像被投射到荧幕上,呈现给观众。
优点:
- 色彩还原较好:由于使用了三个独立的液晶板控制每个颜色通道的光的透射率,3LCD投影仪能够实现较准确的色彩还原,呈现出丰富而真实的图像。
- 体积小,重量轻,携带方便:相对于其他投影技术,如CRT或DLP投影仪,LCD投影仪通常具有更紧凑的设计,体积小、重量轻,方便携带和移动安装
缺点:
- 灯泡亮度衰减:
- 不同品牌、不同类型的投影机灯泡不能互换使用
DLP型投影仪
DLP,即数字光处理器,是美国德克萨斯仪器公司研发的一种高速光电转换器件,利用其生产的DLP投影仪是目前投影仪技术的另一大主流。
DLP以DMD(数字微反射器)芯片作为光阀成像器件。一片DMD芯片是由许多个微小的**正方形反射镜片(微镜)**构成的,微镜按行-列紧密地排列在一起,由支架和铰链连接固定在底座上,并由底部的电机控制其反射角度。
每一片微镜都对应着数字图像中的一个像素。故,DMD芯片的微镜数目决定了一台DLP投影仪的物理分辨率。
每一片微镜在底部电机的带动下,可呈现出两种反射角度,将入射光分别反射到出射光路或吸收光路,从而使出射光强呈现1(开)和0(闭)两种状态,即二进制状态。
DLP中的数字电路对数字图像中的每个像素都进行二进制编码,用于控制对应微镜的开-闭状态和持续时间,从而将二进制数字信号转换为二进制的反射光强信号,所以DLP投影仪是一种反射式调制投影仪。
原理:
- 分色:在高亮白光源前面安装了一个高速旋转的色轮(转速至少60Hz,为1倍速,现可达6倍速);三段式色轮的圆周被分为RGB三段,分别为RGB滤色镜
- 当R段转至光源前时,红光通过,绿蓝依次类推;即通过色轮高速旋转,使白光源顺序分为RGB三种单色光源束。
- 调制:通过数字微镜(DMD)器件分别对RGB三束单色光源束进行可控反射,实现对光源的调制。
- DMD是一个可控反射镜片阵列,阵列中每片反射镜对应一个图像像素,反射镜受静电控制,可呈现两种旋转状态(±12°),分别对应二进制的10两种状态:旋转12°时,入射光被反射到投影光路中,向外投射(=1);旋转-12°时,入射光被反射到吸光光路中,不向外投射(=0)。
- 反射镜的控制电路对SRAM中图像的像素值以二进制形式按位依次扫描,相应改变反射角度及反射时间的长短,使反射光强最终与像素值大小成正比,从而实现调制放大。
- 合成:调制后的RGB三束光信号依次顺序投射到屏幕上,在观众眼中合成彩色图像。
光源:采用DLP技术的激光光源投影机,激光光源有20000小时的寿命,至少是灯泡寿命的10倍。
光源稳定性:传统灯泡在长时间使用之后会出现亮度衰减、画面褪色等问题。整机换掉的话觉得可惜,更换灯泡又费人力物力。而激光属于固态光源性能稳定,光源衰减速度慢,且采用全密封引擎,防尘性高灰尘对光路的影响小,对芯片起到很好的保护作用,对于长时间投影是非常好的选择。
优势:
- 低能耗,激光光源的能耗只有传统高压汞灯50%;
- 低发热,冷光源对散热要求更低,于是投影机就可以更安静;
- 体积小,固态光源发光体的体积不及传统灯泡的十分之一;
- 寿命长,2万小时的寿命,投影机坏了光源可能还没坏;
- 色彩纯净,RBG三基色直接混合,图像更加绚丽;
- 闪闭性,激光光源具有快速开关的特性,可以随时开关,无需任何等待。这使得DLP激光投影仪能够立即启动和关闭,没有炸灯的风险,并且可以实现更高效的投影操作。
Q:一个屏幕上出现多种不同图像如何设计?
A:对于DLP(数字光处理)投影仪而言,在一个屏幕上显示多种不同图像涉及到多种技术和设计考量。DLP投影仪使用微镜阵列(DMD,数字微镜设备)来控制光线的反射,从而生成图像。要在一个屏幕上显示多种不同图像,可以采用以下几种主要方法:
多窗口显示(Picture-in-Picture, PiP)
这是最常见的方法之一,通过在主图像上叠加一个或多个小窗口来显示不同的图像内容。
实现方式:
- 图像处理芯片:现代DLP投影仪通常内置图像处理芯片,支持多窗口显示功能。
- 信号输入:投影仪接收来自不同信号源(如HDMI、VGA、USB等)的输入,处理并在屏幕上显示。
- 用户界面:通过遥控器或投影仪上的控制面板,用户可以选择并调整各个窗口的位置和大小。
分屏显示(Split Screen)
将屏幕划分为多个区域,每个区域显示不同的图像内容。
实现方式:
- 硬件支持:需要投影仪具备多信号输入和分屏处理能力。
- 图像处理:内部图像处理器将不同的信号源分配到屏幕的不同区域。
- 配置选项:用户可以通过设置菜单选择分屏模式(如2x2、3x3等),并选择每个区域显示的信号源。
多投影仪拼接(Edge Blending / Tiling)
使用多个DLP投影仪拼接图像,以实现大屏幕显示多个不同图像内容。
实现方式:
- 投影仪配置:多个投影仪排列在一起,投射到同一屏幕上。
- 图像拼接软件:使用专门的图像拼接软件或硬件设备(如视频墙控制器)来处理和校正图像,确保拼接处无缝衔接。
- 信号分配:通过视频分配器或矩阵切换器,将不同的信号源分配给各个投影仪。
动态内容切换
根据需要在一个屏幕上动态切换不同的图像内容。
实现方式:
- 软件控制:使用控制软件或应用程序,预设不同的图像内容和切换时间。
- 自动化系统:通过编程实现自动切换,例如在演示过程中定时切换不同的幻灯片或视频内容。
基本问题:
- 交互的输入模式
- 基本交互任务
- 辅助交互技术
人机交互与交互界面:
- 基本图形输入设备
- 定位设备;画笔设备;定制设备;选择设备;拾取设备;字符串设备
- 基本交互任务
- 人机交互输入模式
- 常见的辅助交互技术
由于输入设备是多种多样的,而且对一个应用程序而言,可以有多个输入设备,同一个设备又可能为多个任务服务,这就要求对输入过程的处理要有合理的模式。
- 请求模式:输入设备的启动是在应用程序中设置的。应用程序执行过程中需要输入数据时,暂停程序的执行,直到从输入设备接收到请求的输入数据后,才继续执行程序。
- 采样模式:输入设备和应用程序独立地工作。输入设备连续不断地把信息输入进来,信息的输入和应用程序中的输入命令无关。应用程序在处理其它数据的同时,输入设备也在工作,新的输入数据替换以前的输入数据。当应用程序遇到取样命令时,读取当前保存的输入设备数据。
- 事件模式:输入设备和程序并行工作。输入设备把数据保存到一个输入队列,也称为事件队列,所有的输入数据都保存起来,不会遗失。应用程序随时可以检查这个事件队列,处理队列中的事件,或删除队列中的事件。
- 组合模式:输入方式的混合使用。请求模式是在应用程序的控制下工作的;采样模式是通过定期从输入设备中获取数据样本来进行操作。事件模式是通过监听输入设备上发生的特定事件来进行操作。计算机图形输入系统往往不是单一地使用一种输入方式,而是多种输入方式的混合使用,即一个应用程序可以使用多种控制方式,操作几种不同的输入设备。
包括:
- 基本图形输入设备
- 定位设备;笔画设备;定值设备;选择设备;字符串设备
- 基本交互任务
定位:确定平面或空间的一个点的坐标,是交互中最基本的输入技术之一。
- 直接定位是指用定位设备直接指定某个对象的位置,是一种精确定位方式,直接输入设备有光笔、键盘等。
- 间接定位:通过定位设备的运动控制屏幕上的映射光标进行定位,是一种非精确定位方式。其允许指定的点位于一个坐标范围内,一般用鼠标等指点设备配合光标来实现。间接输入设备有鼠标、操纵杆、数字化仪、键盘上的方向键等。
笔划输入用于输入一组顺序的坐标点。它相当于多次调用定位输入,输入的一组点常用于显示折线或作为曲线的控制点。笔划是一种相对自然的交互形式,用户可以通过模拟日常生活中的手势来完成特定任务。
笔划输入方式与定位设备一致,包括直接或间接在屏幕上输入、设置数值坐标等。许多用于定位的物理设备也可以用作笔划设备,如鼠标、轨迹球和图形输入板等。
值得一提的是,书写、绘制螺旋、绘制直线等都是方便快捷的检查方法,可以提供异常神经系统症状的客观证据,有助于震颤的鉴别。
定值(或数值)输入用于设置物体旋转角度、缩放比例因子等。
定值输入方式有:直接输入数值、通过字符串取值、通过比例尺输入、执行上下计数控制命令等。设备包括旋钮、键盘、数字化仪、鼠标、方向键、编程功能键等。
单个元素选择:选择是在某个选择集中选出一个元素,通过注视、指点或接触一个对象,使对象成为后续行为的焦点,是操作对象时不可缺少的一部分。它可以用于指定命令,确定操作对象或选定属性等。
说白了就是按按钮。
区域选择:在选择集中选出一组元素或者选择一个区域,通过使用区域选择工具完成该交互操作。
在多点触控设备上进行选择交互任务时,可能会遇到以下一些问题:
- 精度和准确性:由于手指的尺寸较大,精确定位目标可能比使用鼠标或触控笔困难。这可能导致选择不准确或误选其他元素。
- 目标大小和密度:如果目标元素较小或它们之间的间距较小,用户可能会很难准确地选择所需的对象。这对于具有高分辨率屏幕的移动设备来说尤为显著。
- 胖手指问题:当用户使用手指进行选择时,部分屏幕上的目标可能会被覆盖或盖住,使得目标不可见或无法选择。这是因为手指本身会占据一定的空间。
- 多重选择:在多点触控设备上,同时选择多个对象可能具有挑战性。用户需要找到一种有效的方法来指示、跟踪和管理所选对象。
- 可视化反馈:在选择过程中提供清晰的可视化反馈是至关重要的。用户需要明确知道哪些对象已被选择,以及正在选择的区域是否正确。
- 用户体验:多点触控设备上的选择交互可能会需要更多的手势和动作,这可能增加了用户的认知负担和操作复杂性。设计应该致力于提供直观、简单且高效的选择体验。
可提高多点触摸设备上选择精度的方法:
- 缩放和平移:通过手势缩放和平移画布来调整元素的大小和位置,以便更容易选择小目标。用户可以通过手指捏合或滑动来缩放和平移屏幕上的内容。
- 放大镜效果:在触摸区域周围创建一个局部放大的镜头效果,使用户可以更清楚地看到并选择小目标。这样用户就可以更准确地定位他们的选择。
- 辅助标记或指示器:在用户触摸区域显示可视化标记或指示器,以帮助他们更准确地定位和选择目标。例如,显示目标的放大视图或轮廓。
- 自动辅助选择:利用算法和机器学习技术,根据用户触摸区域的特征和模式来预测用户意图,并自动选择可能的目标元素。这可以根据用户过去的选择行为和上下文信息进行智能推断。
- 虚拟按钮或控件:为小目标创建更大的触摸区域,使其更易于选择。通过增加按钮或控件的大小,可以提供更大的触摸面积以便用户点击。
Q:如何提高对移动目标的精准选择?
A:第一,硬件优化。例如,选择高响应速度的触摸屏,减少触摸延迟,使用户的操作与屏幕反馈更加同步;或者高刷新率可以提供更流畅的视觉效果,减少视觉延迟,提高对移动目标的选择准确性;又比如使用触控笔可以提供更高的精度,特别适用于需要精确选择的应用场景。
第二,软件优化。例如,使用动态预测算法。使用轨迹预测算法,根据目标的运动轨迹预测其未来位置,提前调整选择区域,提高选择的准确性;或者在软件层面进行运动补偿,减少由于目标快速移动导致的选择误差;又比如根据目标的速度和方向动态调整选择区域的大小和形状,提高选择的容错率;或者在用户靠近目标时,自动放大目标区域,便于用户精确选择。
第三,提供视觉反馈。例如,提供即时的视觉反馈,如目标高亮、颜色变化等,帮助用户确认选择;或者为移动目标添加拖尾效果,使用户更容易跟踪目标的运动轨迹。
- 二维图形交互技术
- 三维图形交互技术
- 自然交互技术
- 多点触控;手势识别;表请识别;语音识别;眼动跟踪;行走交互;笔交互
引力场约束也可以看作是一种定位约束,通过在特定图素(如直线段)周围假想有一个区域,当光标中心落在这个区域内时,就自动地被直线上最近的一个点所代替,就好像一个质点进入了直线周围的引力场,被吸引到这条直线上去一样,帮助用户把光标精确地定位在某个端点或直线上。
懒得写了,别的不如看 PPT。
可用性测试:
- 测试目的(Purpose):可用?沉浸感? 治疗效果?
- 实验假设(Hypothesis)
- 测试方法(Method)
- 参与者选择
- 实验设计测试方案
- 准备测试环境和设备
- 确定测量工具
- 安排和执行测试流程
- 测试评价和结果分析
- 确定统计方法
- 分析结果
- 对假设的支持情况
- 讨论(Discussion)
- 围绕测试问题
- 与以往研究的比较
- 主要结果和发现
- 局限与未来研究
不想写了不想写了不想写了不想写了不想写了不想写了不想写了