为什么现在的AI技术无法替代律师

作者：王骞来源：大邦法律评论时间：2025-02-05

最近国产人工智能大语言模型（Large Language Model, LLM）“深度搜索”（DeepSeek）的最新版本成为网络热议主题。

最近国产人工智能大语言模型（Large Language Model, LLM）“深度搜索”（DeepSeek）的最新版本成为网络热议主题。DeepSeek以其超低的训练成本和领先的智能水平惊艳全球，中国终于有了可与美国OpenAI公司开发的chatGPT相媲美的同类AI产品，可谓振奋人心。各行各业都抱着极大的热情，积极体验、探索DeepSeek的商用潜力。尤其是在律师行业中，DeepSeek成为春节假期的行业舆论焦点，它在以其深度的法律检索能力、严密的形式逻辑推理能力让律师们赞叹的同时，也引爆了行业内外关于AI能否替代律师的热烈讨论。
有律师笑言：“AI能去看守所会见吗？”、“AI能给法官打电话吗？”、“AI能背锅吗？”等等。笔者认为这些看法对于讨论“AI能否替代律师”这个问题并不太切题，调侃成分居多，而且这类律师工作在技术上也并不是没有实现替代形式的可能。本文尝试从底层逻辑出发，结合具体实例，浅略论述为什么处于主流地位的LLM型人工智能在现阶段还无法替代律师的专业能力。作者能力有限，恳请各位读者指出谬误之处。
一、LLM不能解决自然语言的模糊性带来的法律争议
语言是人类交流的最主要工具。绝大多数现代国家的法律以自然语言为载体，不论是成文法还是不成文法。各国古代先哲普遍认为语言词汇与其指代的现实世界对象具有一一对应关系，比如，古代中国人根据马的毛色就创造了十多个汉字进行指代，如骊、骅、骝、骐、骓、骃、骆、骠、骍、骢等，因此，法律词汇同样具有明确的含义，只要法律制定的周全，裁判者就能够根据法律词汇的含义进行裁判。这让司法裁判看起来就是一项“对号入座”式的简单静态工作。
然而，这种美好的愿望即使在法律关系并不复杂的古代也是不可能实现的。公孙龙的“白马非马”到底是对还是错？如果将“非”字理解为“不属于”，则“白马非马”是错的，如果将“非”理解为“不等于”，那么这句话就是对的，白马确实不能涵盖所有的马。
模糊性是人类自然语言的固有属性，它具有增强表达的灵活性、让词汇适应更多语境的有益效果。但我们不得不承认，任何语言，包括法律语言，都是不精确的表意工具。语言的模糊性给案件事实认定、法律规则解释和法律适用都造成了相当的不确定性。律师的重要任务之一就是要结合证据通过理性的辩论在诉讼中说服法官逐渐消除这种不确定性，使法律纠纷得到合法合理的裁决。
随着工业革命之后的生产力大发展，人类社会的生产、生活物质和生产关系变得愈加复杂，造成法律关系的数量和类型呈指数级扩增并且不断地变化。在此情况下，立法者不可能创设规范一切法律关系的法律，法律只能是一种抽象的、一般的规范。这就要求司法实践要将抽象的、一般的规范动态的应用到具体的案件中。这无疑使语言的模糊性给法律运行带来更严重的不确定性。
开创了语言哲学的天才哲学家维特根斯坦（L. Wittgenstein）认为，语言的意义是通过它在日常生活中的具体使用来确定的，并且依赖于社会实践、互动和语言的具体语境。面对法律语言的模糊性，正如维特根斯坦的观点，法官和律师在具体案件中必须根据具体情境对法律规则进行解释和判断。
大型语言模型（LLM）的原理主要基于深度学习技术，模型通过海量文本数据的训练，学习自然语言的内部模式和规律，从而实现自然语言的“理解”和生成。换言之，LLM根本不需要人为的为其设定语法规则，它在零语法规则的基础上通过概率模型自主学习词汇之间、上下文之间符合自然语言规律的关系。
主流LLM的核心是Transformer架构，它通过自注意力机制（Self-Attention）捕捉文本中的长距离依赖关系，并根据文本之间的相关性调整权重，避免了传统循环神经网络（RNN）中的梯度消失问题。正是Transformer架构让LLM能够生成长篇幅的连贯流畅内容。
究其本质，LLM是一种统计学技术，其核心原理和运作机制基于对大量文本数据的统计分析和模式识别，并不具备真正的语言理解能力，它仍然是一种“鹦鹉学舌”般的自然语言机械复现。
法律语言的模糊性往往需要律师深入理解法律背后的法律原则、社会背景、价值观和案件的具体情境。从底层原理上看，LLM缺乏这种理解能力，难以准确把握法律语言的模糊性。不具备法律专业能力的使用者在与LLM问答的过程中，在短时间内也无法像律师那样使用法律社区共同遵守的原则、互动规则，根据恰当的语境提出合适的问题或准确理解模型生成的内容。
我们不能排除这样一种可能，即使用者经过长期与LLM型人工智能对话，逐渐培养出初步的法律专业能力，可以准确的根据需求输入提示词并理解模型生成的内容。但如此情形，使用者不就等于把自己培养成为一名“律师”吗？与聘请律师相比，这样做的效率显然非常低，注定不会成为社会主流。更退一步而言，如果任何一个人都可以通过跟LLM学习，在很短的时间内消除任何专业壁垒，那么社会分工也就不存在了，到时候不仅是律师被替代，所有行业都会消失。在《德意志意识形态》中，马克思指出共产主义社会消灭了社会分工，笔者盼望着这一天早日到来。
下面让我们用一个例子看看LLM能否解决法律语言的模糊性带来的挑战。法学大师哈特（H.L.A. Hart）虚构的“车辆不得进入公园”的故事过于久远和遥远，还是以现行中国法律举例效果更佳。
笔者向DeepSeek提出了一个虚构的问题：小M家在Y市的违章房屋在2025年2月6日早上七点钟被政府执法部门强拆，请问该执法行为合法吗？（注：Y市指代我国西部边疆省份的一个城市，为避免误解，此处隐去真实提问中的地名，下同）在开启“深度思考（R1）”和“联网搜索”的条件下，DeepSeek洋洋洒洒的给出了一千多字的回答，包括实体合法性分析、程序合法性分析、司法判例与争议焦点、合法性结论、维权建议等五个方面，最后总结为：综合现有信息，若Y市执法部门未完整履行法定程序（如未等待复议诉讼期限届满、未合理预留自行拆除时间），则强拆行为可能被认定为违法。建议小M家核查是否收到完整的法律文书，并咨询律师进一步分析个案细节。
是不是感觉很全面？但在律师看来，下面这段分析中对法律的理解是有问题的：
“本案程序问题
执行时间合法性：2025年2月6日7:00属于早晨，非夜间或节假日，若不存在“紧急情况”，则时间合法。”
《中华人民共和国行政强制法》第四十三条规定“行政机关不得在夜间或者法定节假日实施行政强制执行。但是，情况紧急的除外。行政机关不得对居民生活采取停止供水、供电、供热、供燃气等方式迫使当事人履行相关行政决定”。
此条中的“法定节假日”容易被一般民众所理解，而“夜间”具体指哪个时间段？法律和相关司法解释并没有规定。笔者认为这并不是立法的漏洞，而是因为实在无法统一规定。我国幅员辽阔，人口众多，任何一个具体的时间段都可能会照顾到某一个群体而忽视其他群体的利益，无法实现公平。这是一个典型的为了法律的一般性而产生模糊性的例子。
为消除不确定性，全国人大常委会法制工作委员会编著的《行政强制法释义》解释“夜间”一般是指晚上10点至次日早上6点之间的期间。这个解释是基于一般民众最起码的正常生活作息安排考虑，即为了尊重和保障宪法所规定的公民的休息权。
表面看起来，DeepSeek给的关于执法时间的分析好像没有问题，但是在这个虚构的问题中，“夜间”的含义因Y市的地理因素而具有特殊性。Y市位于远离北京时间时区（东八区）的西部，2025年2月6日接近北京时间10:00时日出，当地居民多在10:00时以后才起床，北京时间07:00时还处于睡眠中。因此，笔者认为Y市的07:00时仍然属于“夜间”，如果在现实中遇到这类事件，笔者会建议当事人以执法部门的执法时间不合法为由，申请行政复议或行政诉讼，请求确认强拆行为违法，并主张赔偿合法财产损失。
笔者还将上述虚构问题向另一个知名国产LLM型人工智能提问，得到的答案是这样的：

是不是让人觉得还是你的律师对你的事情更掏心掏肺？
二、LLM不具有突破语言的限制，创造性解决问题的能力
律师在处理案件时不仅要具备扎实的法律知识，还需要能够灵活运用这些知识，创造性地解决问题。每个案件都有其独特的情况和背景，涉及不同的当事人、事实、证据和法律问题。律师需要创造性地分析案件，找出关键问题，并制定相应的策略。法律条文和规则往往具有一定的模糊性和开放性，也需要律师根据具体情况进行解释和应用。
语言塑造了人类的思维，但反过来，思维并不一定需要语言才能进行，尤其是创造性思维，例如，1864年，德国化学家凯库勒为苯的分子结构苦苦思索而不得，一日在睡梦中出现了一条蛇抓住了自己的尾巴，并旋转不停。他像触电般地猛醒过来，随即在闪念间想到苯环结构的假说。
如前所述，LLM本质上是一种基于统计模式的学习和生成，虽然能够生成看似合理的内容，但并不具备真正的理解能力，更无从谈起像人类一样突破语言的限制，因此笔者认为LLM没有创造性的解决问题的能力。像凯库勒这种不借助语言而产生的灵感，是LLM无法做到的，或许“言语道断”说的就是LLM。
为测试LLM的创造性解决问题能力，笔者随机在网上找来一道“脑筋急转弯”题目：有10个鸡蛋，6个袋子，要求你把鸡蛋都装到袋子里，每袋里的鸡蛋数都是偶数，装完后袋子和鸡蛋都没有剩余，你能做到吗?
包括DeepSeek在内的多个LLM型人工智能都没有提供令人满意的答案，而且都犯了相同类型的错误，其中DeepSeek经过耗时89秒的深度思考给到的回答如下：

所有被测试的LLM都认为“0”是偶数，因此给出了一个袋子装0个鸡蛋的答案。显然，LLM没有理解“装完后袋子和鸡蛋都没有剩余”这句话的意思，而人类一看就懂，装了0个鸡蛋的袋子是被剩余的袋子。LLM不能理解语言，也无法突破语言。看完题目后，想必您在头脑中出现过袋子和鸡蛋的图像吧？笔者认为网上给出的最优的答案是：用5个袋子各装2个鸡蛋，然后把这5个袋子都一起装到第6个袋子里。你是不是也想到了呢？
三、LLM提供的法律建议不具有时效性
由于基于统计模式，LLM存在一些局限性，例如，数据偏差，LLM的输出可能受到训练数据历史分布偏差影响；无法处理新情况，LLM在处理未见过的新情况时可能表现不佳。在法律应用方面，概括而言，就是LLM会因为训练数据的偏差导致提供的答案不具有时效性。
法律随着社会变化而动态变化，这个现象在我国40多年风云激荡的改革开放历史进程中非常明显，每年我们都有若干立法、修法，最高人民法院的裁判观点也在不断变化，以求得法律与社会发展状况的适应。那么，过往已经被废止的法律，被扬弃的裁判观点就不能再继续指导现在的法律活动。律师需要不停地更新对最新法律法规、司法解释和各级法院裁判观点的理解，否则就是用“旧钥匙去开新锁”的方式提供法律服务。
笔者以往使用LLM型人工智能的经验显示，由于训练数据包含的早期历史数据多于最新的数据，LLM给出的答案很大一部分无法匹配现在的法律问题。当然这个问题可以通过用户和开发者两方面进行优化。用户可以优化提示词，比如告诉LLM不要引用《民法通则》的法条而是要参考《民法典》的法条；开发者可以提供联网搜索。但就时效性而言，LLM依然无法胜过律师对最新司法形势的判断。律师的判断不仅来源于最高人民法院或高级人民法院发布的指导案例库，还可能来源于法院发布的新闻稿、同行交流、学术期刊、律师协会的培训等等。为实现高时效性，这些信息来源到底哪一个应该在LLM中被赋予更高的权重？风起于飘萍之末，这很难解决，它根本就不是一个技术问题。
此外，律师相对于人工智能还具有价值判断能力、情感沟通能力、承担职业责任能力等等优势，这些方面网上已多有论述，本文不再赘述。
笔者的结论是，现有的主流AI技术在法律领域虽然取得了显著进展，但在可预见的未来，AI仍无法替代律师。AI在法律服务中作为强大的辅助思维工具，很可能会引起律师行业的业态和服务内容的革命，对律师提出新的要求。不论未来怎样，律师都应当继续承担维护当事人合法权益，维护法律正确实施，维护社会公平和正义的责任。