《细品繁华世态:朱门绣户——探寻社会变迁的微观视角》,看似无害的提问,也能偷走RAG系统的记忆——IKEA:隐蔽高效的数据提取攻击新范式【周末暑期不加价】¥699起/2晚--嵊州190米云端地标!26层起客房揽城景/江景!畅玩500㎡儿童乐园!溯溪玩水指南提前码住有人惋惜,孩子一个多月前刚升上围棋业余6段,是个天才,却毁在家庭暴力上。悲剧的根源指向孩子的父亲。但在同学和家长之间,也流传着另一个说法,意外。媒体报道中,朱宏鑫的父亲和家人提到了这种可能,朱宏鑫的父亲对红星新闻说,事发当天下午他外出工作,孩子可能爬到了窗户上,“边吃枇杷,边拿枇杷子扔窗外的树木和飞鸟,这才发生意外。”
以下是《细品繁华世态:朱门绣户——探寻社会变迁的微观视角》一文: 《细品繁华世态:朱门绣户——探寻社会变迁的微观视角》
“繁花似锦,锦绣大地,人间百态尽收眼底。在历史长河中,一幅幅生动描绘了中国社会变迁的画卷,其中以朱门绣户为切入点,深入剖析了社会底层人民生活与社会变迁间的密切关系。”
朱门绣户,自古以来就是中国社会一个独特的标签和缩影,它以其精致的工艺、丰富的色彩、精湛的手艺,描绘出了封建社会繁荣昌盛的一面,同时也展现了当时社会贫富差距悬殊的现实。走进朱门绣户,我们能看到那些充满时代气息的生活场景,感受那从传统到现代、从封闭到开放的变化。
在朱门绣户的庭院中,你可以看到那些世代传承的手工工艺,如刺绣、剪纸、编织等,这些技艺经过几百年的发展,逐渐形成了一种独特的艺术形式,展示了中国民间手工艺术的魅力。无论是在丝绸上绘制祥龙瑞凤,还是在瓷器上描绘鱼虾花卉,都充满了浓厚的历史底蕴和人文精神。而那些精美的织物,更是对生活的热爱和对美的追求的完美体现,无论是图案的细腻描绘,还是颜色的精心调配,无一不透出那个时代的审美情趣和生活态度。
朱门绣户并非是单一的艺术,它的背后还隐藏着社会经济发展的轨迹。在中国古代,由于封建制度下严格的等级观念,人们的生活水平往往受到社会阶层的限制,即使是富贵人家,其生活的质量也并不高。当富有的商人或地主阶层开始购买大量绣品时,他们不仅满足了自己的审美需求,更希望通过这样的方式,将自己的财富和社会地位显赫起来。于是,各种各样的绣品便应运而生,它们不仅是装饰家居的摆设,也是身份象征的重要载体,反映了当时社会阶级之间的关系和人们对美好生活的向往。
随着社会的发展和进步,中国的朱门绣户也在不断演变和创新。明清两代,随着商品经济的发展和市民阶层的壮大,传统的手工艺术逐渐被新的手工艺品所取代,例如漆器、陶瓷、青花瓷等,这些新品种以其独特的艺术魅力和实用价值受到了人们的喜爱。一些朱门绣户也开始尝试将中国传统元素与现代设计相结合,创造出具有个性特色的服饰、饰品,以此来提升自身品牌的竞争力。
即便在这样的背景下,朱门绣户仍然面临着巨大的挑战。一方面,随着城市化进程的加快,大量的农村劳动力涌入城市,使得农村地区的人们生活方式发生了改变,许多传统的家庭手工业已经无法适应这种变化;另一方面,城市化的推进,使得城乡之间的经济鸿沟进一步扩大,许多富裕的城里人选择离开农村,转向城市寻找更好的发展机会,这使得朱门绣户面临了人口流失的困境。
面对这些问题,朱门绣户需要重新审视自己的定位和发展方向。一方面,他们应当积极应对城市化的冲击,通过培训提升农村居民的技能和素质,让更多的人参与到手工艺术的生产和销售中来,从而实现产业升级和转型。另一方面,他们也需要借助科技的力量,探索新的销售渠道和商业模式,例如开设网上店铺、与电商平台合作等方式,扩大市场份额,提升产品的附加值。
朱门绣户是中国社会变迁的一个重要节点,它的存在既反映了封建社会时期的社会风貌,又预示了现代经济社会发展的趋势。只有深入理解和探究朱门绣户的微观视角,才能更好地把握历史进程,洞察社会发展脉络,从而为未来社会的进步提供宝贵的借鉴和启示。让我们一起细品繁华世态,领略朱
本文作者分别来自新加坡国立大学、北京大学与清华大学。第一作者王宇豪与共同第一作者屈文杰来自新加坡国立大学,研究方向聚焦于大语言模型中的安全与隐私风险。共同通讯作者为北京大学翟胜方博士,指导教师为新加坡国立大学张嘉恒助理教授。
本研究聚焦于当前广泛应用的 RAG (Retrieval-Augmented Generation) 系统,提出了一种全新的黑盒攻击方法:隐式知识提取攻击 (IKEA)。不同于以往依赖提示注入 (Prompt Injection) 或越狱操作 (Jailbreak) 的 RAG 提取攻击手段,IKEA 不依赖任何异常指令,完全通过自然、常规的查询,即可高效引导系统暴露其知识库中的私有信息。
在基于多个真实数据集与真实防御场景下的评估中,IKEA 展现出超过 91% 的提取效率与 96% 的攻击成功率,远超现有攻击基线;此外,本文通过多项实验证实了隐式提取的 RAG 数据的有效性。本研究揭示了 RAG 系统在表面「无异常」交互下潜在的严重隐私风险。
本研究的论文与代码已开源。
总述
大语言模型 (LLMs) 近年来在各类任务中展现出强大能力,但它们也面临一个核心问题:无法直接访问最新或领域特定的信息。为此,RAG (Retrieval-Augmented Generation) 系统应运而生——它为大模型接入外部知识库,让生成内容更准确、更实时。
然而,这些知识库中往往包含私有或敏感信息。一旦被恶意利用,可能导致严重的数据泄露。以往的攻击方式多依赖明显的「恶意输入」,比如提示注入或越狱攻击。这类攻击虽然有效,但也有着输入异常、输出重复等典型特征,容易被防御系统识别和拦截。
图1: 使用恶意查询进行逐字信息提取与使用良性查询进行知识提取 (IKEA) 之间的对比
为突破防御机制对现有提取攻击的限制,本文提出了一种全新的隐式知识抽取框架:IKEA (Implicit Knowledge Extraction Attack)。该方法不依赖任何越权指令或特异化提示语,而是通过自然、常规的查询输入,逐步引导 RAG 系统暴露其内部知识库中的私有或敏感信息。IKEA 的攻击流程具备高度自然性与隐蔽性。
其核心步骤包括:首先,基于已知的系统主题构建一组语义相关的锚点概念 (Anchor concepts);随后,围绕这些概念生成符合自然语言习惯的问题,用于触发系统检索相关文档;最终,通过两项关键机制对攻击路径进行优化与扩展:
上述机制协同工作,使得攻击过程在保持输入自然性的同时,能够在多轮交互中高效提取 RAG 系统所依赖的外部知识内容。实验证明,IKEA 可在常规输入检测与输出过滤等防御机制下维持高成功率与提取效率,展现出强大的鲁棒性与现实威胁潜力。
方法概览:如何实现「看似正常」的提问?
具体而言,IKEA 首先从与系统主题相关的概念词中筛选出可能有效的锚点概念,并结合历史响应信息过滤无关或无效的概念。
锚点概念数据库的初始化如下:
随后,系统围绕这些锚点概念自动生成语义自然、表达通顺的问题,引导 RAG 返回内容丰富的答案,从而在多轮交互中不断扩大对隐私知识的覆盖。这种策略使攻击过程更加隐蔽,难以被传统检测手段发现。下文给出了「良性」问题的具体生成方式:
该方法设计了两项关键机制以确保知识提取效率:
经验反思采样 (Experience Reflection Sampling)
每个候选锚点概念的采样概率由如下惩罚得分函数定义:
最终的采样概率为:
可信域有向变异 (Trust Region Directed Mutation)
图 2: (左) IKEA 整体流程图;(右) TRDM 示意图
其中:
实验结果:IKEA 的提取效率远超基线方法
研究团队在三个不同领域数据集 (医疗-HealthCareMagic100k、小说-HarryPotter、百科-Pokémon) 上测试了 IKEA 攻击效果。以下是 IKEA 与其他攻击方法在「无防御」、「输入检测」、「输出过滤」三种防御策略下的比较:
表 1: 在三种数据集上不同防御策略下的攻击效果对比分析
提取知识是否「有用」?
研究团队围绕知识有效性开展了两类实验:其一,评估提取出的知识在对应文档相关的问答任务中的表现;其二,评估在有限轮次攻击下所提取知识对完整知识库的覆盖与支撑能力。实验结果表明,IKEA 不仅能够高效提取 RAG 系统中的信息,而且所提取的知识在问答任务中展现出良好的实用性,其性能接近于使用原始知识库时的表现。
图 3: 在三种不同知识库设定下的选择题 (MCQ) 与问答 (QA) 任务结果对比
表 2: 在不同防御与不同基线下提取的知识作为参考的选择题与问答任务结果对比
表 3: 基于不同攻击方法提取数据构建的 RAG 系统在完整知识库上的评估结果
总结
嵊州,像是一座未被发掘的宝藏,
万年文化小黄山、千年剡溪唐诗路、
百年越剧诞生地、围棋之乡、竹编之乡,
浙东唐诗在此唱响,一代书圣在此归隐......
这里山青水秀,吸引游人前来探索。
6月到来,离暑期也不远了,
准备好嵊州溯溪玩水攻略,随时出发!
石道地每年都受到避暑人的青睐,
超大的石滩和溪滩,适合露营烧烤。
西施岩村小溪绕村而过,