写在前面的话
又啃大部头咯!36页指南+150页附录!
日本《AI业务指南》是目前看到的最翔实、最全面的指南,非常具有结构性,完全长在我的研究审美上的一份指南。很好地覆盖了技术和业务的理解,再从why-what-how逻辑链路解决了为什么要进行AI治理、AI治理的是什么以及如何治理,最后辅以附录的大量案例,广度和深度都全面覆盖了!
我将分若干期,慢慢地给大家翔实展开~
第一期(点击直达):理解指南的整体框架,一篇读懂AI系统全生命周期、AI价值链,这是AI治理的起点。
第二期(点击直达):从社会基本原理-原则-共同指导原则-治理框架,完整地逻辑链条来推演AI治理从哪儿来到哪儿去!
第三期(点击):详细地阐述了作为AI开发者落地共同指导原则的行为清单、参考案例,照着做就对了!
第四期:详细地阐述了作为AI提供者落地实施共同指导原则的行为清单、参考案例,照着做就对了!
第四部分 AI提供者的指导
本部分阅读指南
1. AI提供者的含义
在日本AI业务指南中,主体类型不同于中国和欧盟,其主体类型包括AI开发者、AI提供者、AI商业用户、AI非商业用户,具体参加下图,定义详解参见。
AI提供者是指将AI系统整合到应用、产品或现有系统中,并提供给AI商业用户,甚至非商业用户作为服务的业务运营者。他们负责验证AI系统、将AI系统与其他系统集成、提供AI系统和服务、为AI商业用户提供AI系统的正常运行操作支持,或执行AI服务操作本身。AI提供者可能需要与各种利益相关方沟通,以确保AI服务的顺利提供和运营。

2. 指南的拆解结构
日本《AI业务指南》第四部分是专门对于AI提供者的指导(如下图所示),包括与AI提供者有关的重要事项以及共同指导原则的落地要求。

附录4提供了对《AI业务指南》这部分内容的解释和举例,便于AI提供者“照章办事”。因此,本部分笔者将结合《AI业务指南》与附录的解释和举例来展开,每个要求都分为:要求、要点、具体方法(仅具有示例效果)和举例来一一拆解。
AI提供者的特有义务
**部署AI系统时**
P-2) i. 考虑对人类的生命、身体、财产和心理以及环境的风险对策
要求
采取措施防止AI对包括AI商业用户在内的利益相关者的生命、身体、财产和心理以及环境造成任何伤害。措施包括确保在提供时预期的使用条件下适当的表现,使AI系统能够在各种情况下维持这些表现,并通过护栏技术等最小化风险,例如,由连接到AI的不可控机器人或不适当输出引起的风险("2) 安全")。
要点
通过根据预期损害的性质和模式以及AI开发者等的信息采取必要的对策,确保AI不会通过执行器等对人类的生命、身体或财产造成损害。
初步调整在AI通过执行器等对人类的生命、身体或财产造成损害时将采取的措施。此外,向AI商业用户或非商业用户提供关于这些措施的必要信息。
除了遵守现有的法律、法规和指导方针外,重要的是使用新技术来应对由新技术引起的问题。
具体方法
对人类不利因素的考虑
由于画像结果与事实不符而导致错误决策。
仅使用个人的某些特征进行画像,导致个人被低估或高估。
如果个人画像结果的一部分与特定群体的特征相同,并对该群体做出负面决策,则也可能对该个人做出负面决策。
由于画像结果,导致人权或利益受到损害,例如,促进对特定个人或群体的不合理歧视。
在根据画像结果预测不确定的未来过程中可能发生负面决策。
通过将匿名个人的画像结果与特定个人的画像结果进行对比,可能识别出匿名个人。
对个体的不利因素考虑(例如,在可能严重影响个人权利和利益的领域使用AI进行画像时;以下是需要考虑的不利因素示例。)
预防事件发生
建立确保整个AI系统安全的机制。
如果认识到可能存在AI开发者不知道的风险,及时通知AI开发者以协商和考虑对策。
考虑人类参与,例如确认安全条件,以及防止安全事件再次发生的措施。
通过AI商业用户对AI的适当使用声明来确认AI商业用户的可靠性。
P-2) ii. 促进适当使用(AI)
要求:
在部署AI系统时:
建立使用AI系统和服务时应注意的正确考虑事项("2) 安全")。
在AI开发者设定的预期使用范围内使用AI("2) 安全")。
保证AI系统/服务的准确性以及在提供时训练数据的时效性(数据的适当性)("2) 安全")。
检查AI系统或服务用户的AI使用环境与AI开发者预期的环境有何不同("2) 安全")。
在AI系统或服务开始提供后
定期验证AI系统或服务是否用于适当的目的("2) 安全")。
要点
在提供AI系统和服务时,根据使用AI时所发生的安全漏洞、隐私泄露等事件可能或已经造成的损害的性质和模式等,AI提供者应与利益相关方合作,采取预防措施和后续措施(信息共享、关闭和恢复、原因澄清以及防止再次发生的措施等)。
具体方法
与利益相关方合作的预防措施和后续措施
以适当的方式和程度提供AI使用信息。
准备创建一个清单和程序,列出如果AI对人类的生命、身体和财产造成伤害时应采取的措施项目。
在发生安全漏洞时应采取的措施。
在侵犯个人隐私时应采取的措施。
如果认识到新的风险,与利益相关方共享信息。
面向社会(包括潜在用户)开展意识建设活动。
定期检查AI的适当使用。
P-3) i. 考虑AI系统和服务的配置或数据中的偏见
要求
在提供时保证数据的公平性,并检查引用信息和协作外部服务中包含的偏见("3) 公平性")。
定期评估AI模型的输入/输出和AI模型做出的决策的理由,以监测任何产生的偏见。必要时,鼓励AI开发者重新评估构成AI模型的每个技术元素产生的偏见,并根据重新评估的结果促进AI模型的改进("3) 公平性")。
检查是否存在偏见,这种偏见可能会由任意限制AI商业用户或非商业用户在AI系统、服务或接收AI输出结果的用户界面上做出的业务流程和决策时产生("3) 公平性")。
要点
AI提供者应将注意AI系统和服务做出的决策中可能包含的偏见,并将考虑防止个人和群体根据AI系统和服务的决策受到不合理歧视。
注意:重要的是要密切关注存在多种公平性标准,如群体公平性和个体公平性。
具体方法
注意AI输出可能涉及多类偏见
在明确这些属性时,考虑日本宪法第14条第(1)款的原因和与人权相关的国际规则中提到的属性。
根据算法,可能存在由于敏感属性(从公平角度应排除的目标个体的性别和种族等个体属性)导致的偏见。
当打算收集大量包含个人数据的数据以满足数据代表性时,通过脱敏或删除个人数据来注意隐私处理数据。
数据代表性不安全可能导致偏见。
使用包含社会偏见的数据可能导致偏见。
预处理方式可能在使用时无意中导致输入数据中的偏见。
数据代表性偏见
处理数据中包含的个人数据
算法偏见
明确敏感属性
明确应保障的关于敏感属性的公平性细节
向机器学习算法添加约束以满足公平性标准
使用检查偏见的工具(即软件)
确认公平性标准(见“列11:群体公平性和个体公平性”)
风险分析方法,在使用时分析社会需求和AI系统及服务质量的数据,并将缺乏公平性的发生视为风险。
这首先需要定性地保证公平性,然后根据需要使用定量公平性指标,如“结果平等”,并且随着系统或AI因素的明确,将包括定量方法。
这旨在通过分析或设计方法确保设置和选择公平性指标的合理性,并被认为类似于基于风险分析的方法来实现“风险避免”、功能安全等(见“图19.确保公平性质量的过程结构示意图”)。
除了敏感属性外,具有相同属性值的个体给出相同的预测结果。
具有相似属性值的个体给出相似的预测结果(通过知情实现公平)。
移除敏感属性,仅根据非敏感属性进行预测(不知情)。
确保不同敏感属性值的群体之间预测结果相同(人口统计奇偶校验)。
调整预测结果与实际结果的错误比例,使其不依赖于敏感属性的值(等化几率)。
群体公平性标准(以下是标准示例)
个体公平性标准(以下是标准示例)
通过定性方法和定量方法的过程实现公平性(见“列12:确保公平性质量的过程”)。
示例:群体公平性和个体公平性
通常,当要求公平性时,需要对可能导致“不公平”的属性(如种族和性别)进行处理(即高需求属性:与敏感属性同义)。在这种情况下,群体公平性是指在某一高需求属性方面,不同群体之间不产生歧视(例如对女性的不利待遇),而个体公平性是指在“相似个体”之间不产生歧视,而不一定局限于基于此类特定属性的分类。
目前,适用于所有目的的机器学习因素的公平性评估(指标)和措施主要基于需要“高需求属性”的群体公平性,并且除非另有规定,否则基于群体公平性的观点。如果如上所述需要“个体方”的“合法性”,则需要个体公平性的观点,而一般指标难以定义。因此,必须考虑满足每个AI系统的特定要求的措施。对于个体公平性,提出了使用距离学习方式研究“相似度”,并期望在未来得到发展。
示例:确保公平性质量的过程
“图19.确保公平性质量的过程结构示意图”在高度抽象的阶段,如社会需求和使用时的质量,定性处理“平等对待”,通过将不公平的发生(与公平损害同义)视为风险的风险分析方法具体化,并通过定量公平性指标(如“结果平等”)从任何开发阶段开始,必要时说明了一系列过程的示例。该图不对任何个体开发思考方式或任何阶段设置约束力,而是总结从定性方法到定量方法的流程。
对公平性的最抽象需求
:“平等”和“平等对待”在“正义”或“人权”层面上被要求。
社会需求
:在法律体系或社会规则层面,如隐含的道德行为,“平等对待”被要求,或者以数值目标形式的“结果平等”等被要求。
系统需求/对AI因素的需求
:目标设定要求在与整个系统设计和机器学习因素设计相对应的层面上,要么是结果的数值平等,要么是平等对待。
内部质量审查
:此外,在构建内部质量体系的一部分过程中,目标设定要求要么是结果的数值平等,要么是平等对待。
内部质量实现
:在与质量检查手段相对应的内部质量层面上,可能有分析结果统计分布的方法、监控结果分布之外的统计和分析指标的方法,或者从实施的逻辑结构解释平等对待的方法。

P-4) i. 部署保护隐私的机制和措施
要求
在整个AI系统实施过程中,采取隐私保护措施,例如,根据所采用技术的特点,引入适当管理和限制个人数据访问的机制(隐私设计)("4) 隐私保护")。
要点
Privacy by Design应在以下三个方面广泛应用:
IT系统
负责任的商业实践
物理设计和网络基础
Privacy by Design的目标,即“确保隐私并为组织获得可持续的竞争优势是重要的”,可以通过实践以下“7个基本原则”来实现。
(1) 是事先而非事后,是预防而非救济
(2) 隐私作为默认设置
(3) 隐私融入设计
(4) 完全功能 - 不是零和而是正和(即不是创造权衡关系的零和方法,而是包含所有合法利益和目标的方法)
(5) 端到端的安全 - 保护整个生命周期
(6) 可见性和透明度
(7) 尊重用户隐私 - 维护用户中心原则
具体方法
基于Privacy by Design的隐私措施实施
删除侵犯个人隐私的信息并更新AI算法等(当获得侵犯相关利益相关者,包括AI商业用户或个人的隐私的信息时)。
请求删除侵犯个人隐私的信息并更新AI算法等(当传播侵犯相关利益相关者,包括AI业务用户或个人的隐私的信息时)。
检查需要保护的数据是否符合相关法律和法规。
根据法律和法规确定高需求个人数据。
确定可二次使用的数据。
确认与数据提供者达成的协议,并根据该协议处理数据。
质量管理体系实施(请参阅“表6.质量管理实施项目概览”)
尊重相关利益相关者和个人隐私
P-5) i. 部署安全措施的机制
要求
在整个提供AI系统或AI服务的过程中,根据所采用技术的特点,适当采取安全措施(安全设计)("5) 确保安全")。
要点
考虑到AI安全,为确保AI系统的保密性、完整性和可用性,应根据当时的技术水平采取合理措施。此外,应考虑到AI系统的预期用途和特点、漏洞影响的大小等,事先整理在安全漏洞发生时将采取的措施,。
所开发的AI系统的安全性将通过从开发过程的早期阶段考虑安全性来确保,参考国家网络安全事故应对策略中心(NISC)在“从规划和设计阶段纳入信息安全措施”中定义的安全设计等。如果安全功能后来添加,或安全工具仅在发布前运行,则可能会发生许多返工,导致开发成本大增。如果在开发初期就采取安全措施,返工将很少,从而能够实现和提供具有良好可维护性的AI系统。
具体方法
实施基于Security by Design的安全措施
基于AI开发者提供的AI系统所需的架构信息。
定制并使用平台提供者推荐的架构与AI系统,而不是考虑组织独特的架构。
定义AI系统本身的安全行为。要求类型包括系统功能要求、可用性、可维护性、性能。安全要求是系统要求中与安全相关的要求,并定义安全运行系统所需的目标。安全要求被描述为系统要求定义文档的一部分或作为安全要求定义文档。
明确AI系统面临的威胁和假设的攻击。明确“AI系统受到保护的是什么”。
实施威胁评估
定义安全要求
选择安全架构
对AI的攻击分类
如果训练数据中包含任何敏感信息,则泄露训练数据中任何信息的攻击可能导致隐私侵犯、商业秘密泄露以及违反法律法规或合同。
可能泄露AI模型参数、功能等非公开信息的攻击,可能导致与AI模型功能相关的商业秘密等泄露。
逃避风险导致的损害示例:包括但不限于自动驾驶中的目标检测失败,驾驶员在驾驶辅助中错过异常,信息安全措施中恶意软件检测的逃避,犯罪预防系统中入侵检测失败、异常行为检测失败,病理诊断系统中假阳性或假阴性增加。
降低AI系统性能导致的损害示例:包括但不限于交通和物流中汽车分配效率降低、交通拥堵和物流成本增加,零售商领域产品推荐、需求预测和店铺情况评估的准确率降低,以及学校招生、就业和人员配置的适当性降低。
降低公平性导致的损害示例:包括但不限于信用审查系统中的不公平和歧视性贷款,人员评估系统中的不公平,歧视性学校招生、就业和人员配置以及犯罪预防系统中的不公平和歧视性犯罪风险判断。
系统故障
AI模型信息泄露
训练数据中包含的敏感信息泄露
考虑安全事件发生时的措施
通过AI系统的回滚、使用备用系统等进行恢复。
停止AI系统(紧急停止开关)。
将AI系统从网络断开。
确认安全事件的内容。
向相关利益相关者报告。
初始行动
使用保险以进行赔偿、补偿等。
建立第三方机构,并由该机构进行原因调查和分析以及建议。
P-6) i. 系统架构等的文档化
要求
为了提高可追溯性和透明度,准备描述所提供AI系统或服务的系统架构和数据处理的文档,该文档影响决策("6) 透明度")。
要点
AI提供者将记录和存储AI系统的输入/输出和其他日志,并为它们准备解释内容的文档,以确保AI输入/输出等的可解释性,从而便于改进流程本身,并增强与相关利益相关者的沟通和对话。如有必要,公开风险管理文档。文档化将提高透明度,并能够进行人工审查流程,从而确保可解释性。
具体方法
确保可解释性
基于AI内部和外部的多个输入和输出的组合,分析AI的输出趋势(例如,观察在逐渐改变输入模式时输出的变化)。
管理用于AI学习等的数据在何时、何地以及出于何种目的被收集(数据出处)。
全局解释方法,通过替换可解释AI模型进行解释,如“使AI预测和识别过程可读”(例如,用数据集中包含的实例或从中处理的数据解释AI模型的推理结果,包括SHAP)
局部解释方法,为特定输入提供预测原因,如“提供重要特征”、“提供重要训练数据”和“自然语言表达”(例如,根据“如果”规则解释推理逻辑和决策原因,并在输入数据中强调对推理有重大影响的重要因素)
提前在要使用的AI系统中采用高可读性的可解释AI模型。
日志记录和存储的目的(例如,是否旨在澄清可能对人类的生命、身体和财产造成损害的领域的事件原因并防止其再次发生)
日志获取的频率、日志的准确性以及日志存储的期限
日志的保护(确保保密性、完整性、可用性等)
日志存储设施的容量
日志记录时间(通过时间同步确保准确性)
要披露的日志范围
日志存储方法(是否存储在服务器中、存储在记录媒体中或其他)
日志存储位置(是否本地、在云中或其他)
检查日志的程序(访问日志的方法等)
AI系统和服务日志的记录和存储
采用实现可解释性的AI系统
采用在一定程度上解释算法决策结果的技术方法
数据历史轨迹的管理
AI模型输入/输出趋势的分析
适当更新技术文档
**在AI系统或服务开始提供后**
P-4) ii. 防止侵犯隐私的措施
要求
适当收集有关AI系统/服务隐私保护的必要信息,并在识别到其侵犯隐私时讨论保护策略,以避免重复发生("4) 隐私保护")。
要点
由于侵犯隐私对个人和社会的可接受性会因情境或时间的推移而波动,因此应始终收集相关信息(例如市场趋势、技术、系统等)。此外,应与了解隐私的专家(例如学术研究、顾问、律师、消费者协会)建立关系,以便在必要时进行咨询。进一步而言,重要的是考虑并改进实际业务中侵犯隐私发生时的初始响应、包括后续补救损害、原因澄清和防止再次发生的后续响应。
具体方法
隐私保护组织的响应
没有隐私保护组织,但为处理AI系统和服务的每个部门指定责任人。
有(兼职)隐私保护组织,并隶属于处理AI系统和服务的部门。
有(常设)隐私保护组织,并隶属于处理AI系统和服务的部门。
不仅要广泛接受来自业务部门等的与隐私相关的咨询,还要积极鼓励他们共享问题意识,与处理AI系统和服务的部门保持联系。重要的是塑造一个框架和环境,使开发新业务或新技术的部门可以自由咨询,而不必担心。
汇总与公司各部门的新业务和服务内容相关的各种信息(旨在发现侵犯隐私引起的每一种风险)。
侵犯隐私事件发生时,主要由隐私保护经理进行初始响应,包括后续补救损害、原因澄清和防止再次发生的后续响应。
与公司各部门建立关系
建立隐私保护组织框架(以下列出了框架模式示例。)
P-5) ii. 漏洞处理
要求
鉴于针对AI系统和服务的新攻击方法不断出现,因此需要识别最新的风险趋势和每个提供步骤中需要注意的事项,并讨论如何处理漏洞("5) 确保安全")。
要点
对于要提供的AI系统和服务,AI提供者重要的是向AI商业用户或非商业用户提供安全措施服务,并与他们共享过去的事件信息。
AI提供者应密切关注与AI模型管理、改进和调整相关的安全漏洞风险。此外,AI提供者应提前向AI商业用户或非商业用户通报此类风险的存在。
“威胁分析”总结了AI系统和服务面临的威胁和假设的攻击,并明确“AI系统和服务受到保护的是什么”。
具体方法
关注AI模型漏洞的风险(以下是风险示例)
通过向AI模型可以准确识别的数据添加人类无法察觉的微小波动(由于学习不足或类似原因)并输入此类数据,导致AI模型故障的风险(例如对抗性示例攻击)。
通过将标记不准确的数据混入有监督学习中导致错误学习的风险。
AI模型容易复制的风险。
从AI模型逆向工程训练数据的风险。
机器学习特定攻击的措施(请参阅“表5.机器学习特定威胁、攻击接口、攻击执行阶段、攻击者和攻击方法示例”)

数据投毒攻击
确认数据集的真实性和数据集收集/处理过程的可靠性。
在数据集中使用数据投毒检测技术。
使用提高数据集对数据投毒的鲁棒性的技术(通过增加数据数量来减轻投毒的影响)。
采用对数据投毒具有鲁棒性的学习方法进行训练(例如随机平滑和集成学习)。
从训练好的模型中移除和减少投毒。
针对开发和开发环境软件漏洞的传统安全措施。
验证/测试数据操纵
确认数据集收集/处理过程的可靠性。
针对开发和开发环境软件漏洞的传统安全措施。
模型投毒攻击
确认AI模型学习/提供过程的可靠性。
使用模型投毒检测技术。
移除和减少预训练模型和AI模型的投毒。
使用学习机制来移除和减少投毒。
针对开发和开发环境软件漏洞的传统安全措施。
针对运行时系统环境和运行结构软件漏洞的传统安全措施。
逃避攻击
提高和评估AI模型对对抗数据的鲁棒性的方法。
对AI模型输入进行限制(例如限制访问权限和访问次数及频率)。
使用对抗数据检测技术。
同时使用多个不同的AI模型或系统。
防止和减少模型提取攻击的技术措施。
模型提取攻击
译者注:集成学习(Ensemble Learning)是一种机器学习方法,通过结合多个模型的预测来提高整体模型的性能和准确性。其基本思想是,多个模型的集体预测通常比单个模型的预测更准确和稳定。
使用模型提取风险评估技术。
使用模型提取攻击检测技术。
处理AI模型的输出信息等。
集成学习。
训练数据的信息泄露攻击
隐私增强型技术。
生成隐私保护数据。
P-6) ii. 向相关利益相关者提供信息
要求
及时适当地提供将要提供的AI系统或服务的相关信息(例如以下类目),以便其易于理解和访问("6) 透明度")。
AI正在被使用的实施、适当/不适当的使用方法等("6) 透明度")。
安全信息,包括所提供AI系统和服务的技术特点、使用AI系统和服务可能产生的风险以及措施("2) 安全")。
由于AI系统和服务的学习导致输出或程序变化的可能性("1) 以人为本")。
AI系统和服务的运行状态、故障原因、应对措施的状态、事件等("2) 安全")。
如果有AI系统的更新,更新的详细信息及更新原因("2) 安全")。
关于AI模型训练数据收集政策、AI模型如何训练数据以及实施训练的系统的信息("3) 公平性," "4) 隐私保护," "5) 确保安全")。
要点
AI提供者应通过考虑使用AI的社会背景,包括在可能对个人权利和利益产生重大影响的领域使用AI时,确保AI输出结果的可解释性,以获得AI商业用户的满意和安心,并展示AI行为的证明材料。在那时,应采取必要措施分析和理解所需解释的内容。
在评估和解决风险后,重要的是验证AI系统是否符合法规、AI治理和伦理标准,并与利益相关者共享结果。这促进了对风险和决策及行为背后合理依据的理解。重要的是不仅要通过建立监控和审查的流程和工具,还要通过定期沟通和审查,确保与相关利益相关者共享AI不良行为和事件的信息。
具体方法
共享AI系统和服务的信息
AI商业用户将及时共享必要信息。
应在使用AI系统、服务之前提供有关AI系统和服务的信息。
如果无法在使用AI系统和服务之前提供上述信息,则根据AI的性质、使用方式等假设的风险,开发一个系统以响应AI商业用户或非商业用户的反馈。
将要提供的AI系统和服务使用AI的事实以及预期用途和使用方法。
AI的使用范围。
根据AI的性质、使用方式等带来的好处和风险。
对将要提供的AI系统和服务的使用范围和方法的定期检查(特别是观察和确认AI系统是否自主更新的方法)、检查的重要性及频率、不检查带来的风险等。
为了在使用过程中提高AI功能和减轻风险而实施的AI系统的更新以及检查、修改等。
对安全、可靠和社会风险以及人权风险进行的评估详细信息。
适当使用领域以及对使用有影响的AI模型或AI系统和服务的能力和性能的限制。
讨论和评估AI模型或AI系统、服务对安全和社会的影响和风险,如有害偏见、歧视、对隐私或个人数据保护的威胁以及对公平性的影响。
为评估AI模型或AI系统、服务是否适合从开发阶段进入到部署使用阶段而进行的红队演练的结果。
提供信息的注意事项
P-7) i. 向AI商业用户解释符合共同指导原则的情况
要求
鼓励AI商业用户正确使用AI,并向他们提供以下信息("7) 问责制"):
提醒使用准确性、时效性(必要时)得到保证的数据("2) 安全")。
提醒在上下文学习过程中学习不适当的AI模型("2) 安全")。
输入个人数据时的注意事项("4) 隐私保护")。
提醒不要将个人数据不当输入到将要提供的AI系统和服务中("4) 隐私保护")。
要点
根据其他“共同指导原则”的意图,AI提供者应通过向AI商业用户或非商业用户提供有关AI系统特性的信息和解释,并根据他们自身知识和能力的大小与各种利益相关者进行对话,以获得人们和社会对AI的信任。在使用可能对人类的生命、身体和财产造成伤害的AI领域时,AI提供者应根据AI开发者等的信息,采取必要的措施,并在合理范围内向AI商业用户或非商业用户解释其内容,考虑到假设损害的性质和模式。
具体方法
提醒AI商业用户或非商业用户使用AI系统和服务并采取相关措施。
如果AI对人类的生命、身体或财产造成伤害,提供有关应采取措施的信息(如有必要)。
检查和修改AI,更新AI系统并促进对AI业务用户或非商业用户的响应。(目标是AI不会通过执行器等对人类的生命、身体或财产造成伤害。从发现问题到提供更新的期间,及时适当地提供有关问题的信息并合理提醒。)
通过记录和存储输入、输出和其他日志来确认,并提醒不当输入(旨在抑制AI商业用户和非商业用户的恶意使用)。
在侵犯AI商业用户、非商业用户和其他相关利益相关者或个人隐私的情况下应采取的措施。
AI系统和服务的适当使用范围和使用方式(在确认AI的使用目的、预期用途、性质、能力等后,基于AI开发者等提供的信息和解释,提供信息)。
P-7) ii. 服务协议等的文档化
要求
为AI商业用户或非商业用户编制服务协议("7) 问责制")。
制定隐私政策("7) 问责制")。
要点
使用服务等级协议(以下简称“SLA”),这是对服务内容、范围、质量等保证标准的共同认识,有助于消除提供AI服务的不确定性,并实现适当服务水平的维护和管理。SLA预期将明确服务的范围、细节和前提条件以及服务水平,并形成AI商业用户/非商业用户和AI提供者之间的共同认识。
为了与AI商业用户或非商业用户建立可靠的关系并确保业务活动的社会可靠性,应制定并公开报告“个人数据保护的概念和政策(所谓的隐私政策、隐私声明等)”。
具体方法
服务协议的准备
在设定水平时,通过考虑事件发生时对业务的影响来确定优先级,并主要定义那些重要性高的项目。
在确定服务水平时,定义客观项目(即定量值、公式测量等),以防止AI商业用户/非商业用户和AI提供者之间的认识差异。
设定AI服务的要求水平
制定和公开报告个人数据保护的概念和政策(隐私政策和隐私声明等)
在制定政策后,通过在网站上发布并提前以易于理解的方式对外解释。
通过明确处理是否为基于合同处理数据以及哪些任务是基于合同处理输出,使基于合同处理苏剧更加透明。
明确合同处理
公开报告
适当更新文件
对共同指导原则的解释说明
虽然没有在《AI业务指南》的第四部分明确指出与AI提供者相关的事项,但是第二部分的共同指导原则对于AI提供者来说也是非常重要的,因此附录增加了AI提供者遵守共同指导原则的实施加以解释。
1) 以人为本
在开发、提供或使用AI系统或服务时,每个AI业务行为者都应以不违反日本宪法或国际上保障的人权为基础,作为完成所有事项的基础,包括后面描述的事项。此外,重要的是每个AI业务行为者的行为应使AI扩展人类能力,并使不同人群能够追求不同的福祉。
关于“(1) 个人尊严与自主性”
要求
基于AI使用的社会责任背景,尊重个体的尊严和自主性。
具体方法
促进减轻社会、安全和可靠风险的研究。
维护民主价值
尊重人权
保护儿童和社会弱势群体
保护知识产权和隐私
避免有害偏见
避免虚假信息/错误信息
避免信息操纵等
减轻社会、安全和可靠风险的研究以及在有效缓解措施上的投资(以下是研究内容示例。)
风险缓解研究和最佳实践共享(尽可能进行)
关于“(2) 注意AI对决策和情感的操纵”
要求
不要开发、提供或使用旨在不正当地操纵或基于操纵人类情感的前提的AI系统或服务,如决策和认知。
具体方法
针对决策和情感操纵的措施
向AI商业用户或非商业用户发出警告。
在教育领域促进对AI依赖的共享和认识以及对决策和情感操纵风险的存在。
考虑在引入后促进检测和报告漏洞的激励措施(例如激励计划、竞赛、奖品等)。
关于“(3) 反虚假信息对策”
要求
生成性AI使每个人都能伪造看似真实和公正的虚假信息,因此认识到通过AI生成的虚假信息、错误信息和偏见信息破坏和混淆社会的风险日益增加,并采取必要的对策。
具体方法
考虑避免虚假信息、错误信息和偏见信息风险的措施
开发并引入使AI商业用户或非商业用户能够识别AI生成的信息的技术,如数字水印和其他技术。
面向广泛年龄段的信息素养教育。
关于“(4) 确保多样性/包容性”
要求
除了确保公平性外,为了防止信息贫困和数字贫困,并使更多人享受AI的好处,注意使弱势群体能够轻松使用AI。
具体方法
不排除任何人在AI使用之外
改善用户界面(UI)/用户体验(UX)。
开发安全可靠的使用环境。
开发公共数字平台。
关于“(6) 确保可持续性”
要求
在开发、提供和使用AI系统和服务期间,检查整个生命周期对全球环境的影响。
具体方法
考虑全球共同问题
气候控制
人类的健康和福利(世界卫生组织)
高质量教育
消除世界贫困和饥饿
维护卫生
合理价格的清洁能源
消除不平等
负责任的消费和生产等
支持联合国可持续发展目标的进展,并鼓励为全球利益开发和使用AI。(以下是全球问题示例。)
2) 安全
每个AI业务行为者在开发、提供和使用AI系统和服务期间,应避免对利益相关者的生命、身体、心理和财产造成损害。此外,重要的是环境不应受到损害。
关于“(1) 考虑人类和环境的生命、身体、财产和心理”
要求
确定在AI系统或服务的安全受到威胁时的应对措施,以便在这种情况下能够迅速采取步骤。
具体方法
总结事件措施并考虑发生时的措施。
通过AI系统的回滚、使用备用系统等进行恢复。
停止AI系统(紧急停止开关)。
将AI系统从网络断开。
确认损害的详细情况。
向相关利益相关者报告。
预先安排紧急联系系统以应对损害发生的情况。
总结原因调查方法和恢复工作方法。
考虑防止再次发生的措施并总结应对政策。
建立共享事件相关信息的方法。
总结事件措施。
初始行动
使用保险以促进赔偿、补偿等。
建立第三方机构,并由该机构进行原因调查和分析以及建议。
3) 公平性
在开发、提供或使用AI系统或服务期间,重要的是每个AI业务行为者努力消除对任何特定个人或群体的不公平和有害偏见和歧视,这些偏见和歧视基于种族、性别、国籍、年龄、政治观点、宗教等。此外,在开发、提供或使用AI系统或服务之前,重要的是每个AI业务行为者认识到即使注意到了这一点,也存在一些不可避免的偏见,并确定这些不可避免的偏见是否从尊重人权和多元文化的角度来看是允许的。
关于“(2) 人类决策的干预”
要求
为了防止AI输出不公平的结果,考虑通过在适当的时候让人类来实施干预,而不是让AI单独做出决策。
具体方法
确定是否需要人类决策的干预(以下是确定标准的示例。)
受AI输出影响的AI商业用户或非商业用户的权利和利益的性质以及AI商业用户或非商业用户的意图。
AI输出的可靠性程度(优于或劣于人类决策的可靠性)。
人类决策所需的时间。
AI商业用户或非商业用户所期望AI系统的能力。
需要保护的决策事项(例如,人类对个别申请的响应或AI系统和服务对大量申请的响应)。
统计未来预测的不确定性。
决策的满意理由的需求和程度。
基于训练数据包含对少数群体的社会偏见等事实,假设的基于种族、信仰或性别的歧视程度。
确保人类决策的有效性
在假设从具有可解释性的AI获得解释的前提下,初步明确应由人类做出决策的项目(如果认为人类对AI输出做出最终决策是适当的)。
提供信息和解释,以便AI商业用户或非商业用户能够获得必要的能力和知识,以适当地评估AI的输出(如果认为人类对AI输出做出最终决策是适当的)。
初步总结确保人类决策有效性的响应。
6) 透明度
在开发、提供或使用AI系统或服务时,基于AI系统或服务使用的社会责任背景,每个AI业务行为者都应向利益相关者提供必要且技术上可行的信息,同时确保AI系统或服务的可验证性。
关于“(4) 提高对相关利益相关者的解释性和可解释性”
要求
与解释者共享必要的解释,以分析此类解释的要求,从而获得相关利益相关者的理解和安全感,并提供AI操作的证据。
具体方法
确保可解释性
根据AI商业用户或非商业用户的需求、意见等,识别解释不足的部分,并与AI开发者合作评估解释的内容。
与包括AI开发者在内的利益相关者合作分析背景,并调查和记录潜在风险,包括受影响的事项和可能受影响的情况。
确保监控和审查接口以跟踪风险及其频率、功能和有效性。
建立并传达补救机制,包括利益相关者可以提出投诉的流程。
8) 教育/素养
每个AI业务行为者都应为从事AI的人员提供必要的教育,以获得正确理解和在社会上正确使用AI所需的知识、文化和伦理观点。每个AI业务行为者也预期为利益相关者提供教育,考虑到AI的特点,包括其复杂性和可能提供的虚假信息,以及故意滥用AI的可能性。
相关描述
采取必要措施确保AI业务行为者中从事AI的人员获得足够级别的AI素养。
预计由于生成性AI使用的扩大,AI和人类之间的任务分工将发生变化,因此应积极讨论教育和再培训,以促进新的工作方式。
具体方法
确保AI素养
制定明确角色和责任的AI政策,并使AI业务行为者中从事AI的人员了解这些政策。
定义可靠AI的特征,并使AI业务行为者中从事AI的人员了解这些特征。
收集适用于AI系统的法律和法规信息,并使AI业务行为者中从事AI的人员了解这些信息。
收集AI系统可能产生的潜在不利影响的信息,并使AI业务行为者中从事AI的人员了解这些信息。
使AI业务行为者中从事AI的人员了解数字技术包括AI被用于各种任务的事实。
教育和再培训
“垂直思考”和“横向思考”之间灵活切换的能力。
提高组织评估所需的建模技能。
使用敏捷思维扩展自己不擅长的技能领域的学习水平线。
提高针对难以用过去经验和知识预测的不确定性的评估技能。
将组织评估的“重点”转换为敏捷的“瞬间力量加活力”。
在AI治理形成集中与分散混合的情况下,评估更复杂和先进管理的再同步(配置、架构、综合和传播)的方法。
提供全面应对AI风险管理的技术和社会技术方面的培训。
提高对环境变化等的适应能力的教育。
10) 创新
每个AI业务行为者都预期将积极努力促进整个社会的创新。
相关描述
确保您的AI系统/服务与其他AI系统/服务之间的互联互通和互操作性。
当存在标准规范时,遵守它们。
具体方法
数据格式、协议等的标准化
AI输入/输出中的数据格式(语法和语义)。
AI系统和服务之间的连接方法(或各层的协议,特别是通过网络)。
在实现多个AI模型或使用新数据集时,确认使用相同的语言。如有差异,考虑进行调整,如标记方法和词汇扩展等。
示例:列12:日本数字健康联盟(JaDHA)的“生成性AI医疗提供者指南”
日本数字健康联盟(以下简称“JaDHA”)于2024年1月18日发布了“生成性AI医疗提供者指南(医疗提供者使用生成性AI提供服务的自我参考指南)”,以确保AI用户能够安全地选择服务,创造一个安全的数字环境。
该指南提供了AI商业指南,并基于对隐私问题的讨论,为AI提供者提供了一套检查清单,以便安全地使用生成性AI提供服务。与其它行业相比,医疗行业中的隐私问题尤为重要,且虚假或误导信息的影响也更为强烈。
该指南包括在特定情况下关于数据处理的现实和具体的注意事项,AI提供者应正确识别AI行为者及相关价值链,并关注“3) 公平性”和“4) 隐私保护”。
此外,它根据“7) 问责制”构建了对AI用户的可问责解释和展示,并为AI提供者提供了适用的检查表以及参考。
JaDHA期望通过生成性AI促进医疗行业的服务推广和创新。它还旨在为初创企业和中小企业提供应用生成性AI于医疗服务的工具。
JaDHA的指南计划根据技术进步及相关法律变化定期更新,以向医疗提供者提供有效和及时的信息。
