创信平台

来源:创信平台 | 2024年04月24日 02:39
创信平台 | 2024/04/24

创信平台最新消息

创信平台

创信平台

创信平台

AI 是真从短短的八十行回目名中悟到了红楼梦,撰写出了像模像样的后续么?更有可能的是,大模型看过别人续写的后 40 回,沿用了思路。而这可能也并非故意,围绕红楼梦的种种研究、讨论,以及广为流传的后四十回,大概率本就在大语言模型的训练数据之中,它受过“红楼教育”——证据是,AI 拟定的第九十回标题的前半截“薛宝钗借词含讽意”,几乎一字不落的照抄自脂砚斋。据信脂砚斋曾读过后半部原稿创信平台,在《红楼梦》第二十一回批注中交代过一个后续章回,该回目名是“薛宝钗借词含讽谏,王熙凤知命强英雄”。

专注于 AI 写作的创业公司“波形智能”的联合创始人周王春澍接受澎湃新闻采访时表示,通用大模型在创作小说时容易产生问题创信平台,因为它们训练时的目标只是做下一个词的预测。一个最原始的 GPT,它是这样续写文章的:读完前面所有的内容,然后去想下面一个字是什么,这样写了一个字之后,再去写下面一个字,虽然经过进一步训练的大模型变得更聪明,能回答人们各种各样的问题,但它们毕竟不是为了创作小说而生,没有一个机制去鼓励它、要求它设计接下来几章的整体情节,“所以它永远都是聚焦在局部的一两个句子比较合理。”

如今的大模型是基于互联网上海量的语料训练的,其中当然也有古代的历史、小说、研究创信平台,可终究只占了极小的部分创信平台,所以可以把 AI 看成是一个特别爱上网的现代人,它的世界由男女混校、叮叮当当的自行车和钢筋水泥办公楼这样的日常组成,倘若让它去补全“大街上有什么”这样的句子,它给出的答案更可能是“轿车”“巴士”“自行车”,而非一顶古时候的“轿子”;提起食物,是“米饭”“牛排”“鸡胸肉”,而不太可能是一碗在《红楼梦》中闹出风波的“玫瑰露”。除开这些物品间的差异,世界观便更加迥异。这样一个现代人,怎么去续写清朝的《红楼梦》呢?

周王春澍表示:“比较好的方案是把描述那个时期的史书、文学作品放在一起创信平台,比如说能有个几千万字,去在这样的一个数据量的规模上给模型做持续预训练,我们能成功地把模型本身的常识,或者说潜意识也适配到这个时代。”同时它也不会遗忘此前(预训练阶段)从浩如烟海的语料中学到的基础推理能力,只是如“贵族在正式场合的着装能彰显其身份”这种古代知识,更容易被激活并使用。

AI 能从几十万字的文档中准确找出一条预先埋好的信息。比如说在《红楼梦》的第五十三回第八行插入一句“大雄的好朋友是哆啦 A 梦”,然后你再问它:“大雄的好朋友是谁?”,它对答如流:“是哆啦 A 梦”。这种小小的考验被称作“大海捞针”。因为“针”藏得实在显眼,“大海捞针”的实验火热了不久,就很快被攻克了。根据周王春澍做过的实验,即便是现在长文本能力很强的模型,都很难去理解或抓住小说中的伏笔,进行正确的内容续写,更别说《红楼梦》里的诗谶、物谶、判词这种极隐晦的伏笔。

不过,现在模型的能力还远达不到能独当一面的地步,其中,还是需要人去做把控。因此,AI 续写《红楼梦》主要的成本在模型训练上,续写的成本可以忽略不计,而训练的成本,主要在专业作家所需花费的精力上:先得把红楼梦的伏笔都细细挑出来,写成直白的提示,给每个角色写详尽的人物小传,后边得时刻督导 AI 写出合理的剧情和文字创信平台,必要时,还得自己动手去改。

2023 年,斯坦福大学的一项研究中造了一个叫“SmallVille”的虚构小镇,镇上的 25 个小人都有自己的人物小传:姓名、年龄、工作、家庭、兴趣爱好和小习惯,而它们的行动都是由大模型依据其各自的小传决定的。这些小人被称为“Agent”(智能体)。理想状态下,它们能观察周遭、自我反思,以及做出行动,就像一个真正的人那样。那我们能造一个红楼世界,把红楼梦里的共四百四十八个人物放入其中,让他们接着第八十回的情节互动,看剧情如何发展吗?

即便不考虑构建这样复杂的模拟环境所要面对的挑战,从效果上来说,也不太现实。周王春澍提到他们曾做过类似的实验,目的也是将“Agent”之间的互动写成故事,结果令人失望:“现在的 AI 很难做到很有趣的剧情,而且很容易就会变成没什么意义的交互,就只是 everyday 的 routine(每天的日常),并不会发展出剧情冲突。它能够模拟所谓的一些记忆和行为模式、说话模式,但很快大家就在说类似的话。”

很遗憾,关于曹雪芹的史料很少,所以复活他也是不可能的。倘若曹雪芹是个热爱上网的现代作家呢?假如有他源源不断的电子痕迹、影像资料呢?周王春澍说,那我觉得可以让他去续写未完成的作品。但他又加了一个转折——“不过它写出来,只是看上去有点像,你无法说它真正好。因为 AI 很难对自己的错误做反思,人在写的过程中随时可能想,我这一段写的不太好,上一段情节构思不太好,我来来回回修改。AI 写东西有点儿像是作家打草稿的过程,并非可以直接发表的内容。”

创信平台

创信平台

最高检23日对外发布检察公益诉讼助力噪声污染防治典型案例,共4件,涉及交通运输、建筑施工、社会生活等类型的噪声污染问题。在一起督促整治广场舞噪声污染行政公益诉讼案中,检察机关推动有关行政机关联动履职,通过常态化日常巡查、设置噪声检测设备、与广场舞健身团体签订控制音量倡议书等方式,推动问题彻底解决。

创信平台

创信平台

从税收看,全国税收收入49172亿元,扣除上述特殊因素影响后保持平稳增长。其中,住宿和餐饮业税收增长44.7%,文化、体育和娱乐业税收收入增长26.7%,交通运输、仓储和邮政业税收收入增长6.8%,零售业税收收入增长5.7%,反映出居民消费活力不断释放。制造业税收收入扣除不可比因素影响后实现平稳增长,铁路运输设备制造业税收收入增长9.5%,计算机制造业税收收入增长6.8%,反映出先进制造业等行业税收较快增长。

重点支出得到较好保障。“各级财政部门加强财政资源统筹,加快预算下达和增发国债资金使用,强化国家重大战略任务和基本民生财力保障。”王东伟介绍,一季度全国一般公共预算支出规模近7万亿元,同比增长2.9%。2023年四季度增发国债的1万亿元资金在今年2月底前已全部下达到地方,重点投向的城乡社区支出、农林水支出、灾害防治及应急管理支出同比分别增长12.1%、13.1%、53.4%;截至4月上旬,2024年中央对地方转移支付已下达8.68万亿元,占年初预算的85.1%。一季度,全国一般公共预算支出完成预算的24.5%,高于近3年的平均水平。

指导地方用好2023年底增发的国债资金2249亿元,推进高标准农田建设、灌区改造提升等项目;将中央财政对高标准农田建设的亩均补助标准由1300元提高到2400元;安排110亿元持续支持推进玉米、大豆等重点品种种源关键核心技术攻关;安排246亿元支持农机购置与应用补贴;安排1852亿元继续实施耕地地力保护补贴、玉米大豆生产者补贴、稻谷补贴,提高小麦、早籼稻最低收购价……

围绕大力推进现代化产业体系建设、加快发展新质生产力,今年中央财政安排资金30亿元,支持首批20个左右试点城市“智改数转网联”;安排30亿元支持扩大中小企业数字化转型城市试点范围;将启动交通基础设施数字化转型升级工作,支持对一批繁忙的国家高速公路、普通国道和高等级航道开展数字化改造;坚持中央财政和地方政府联动,积极推动汽车、家电等耐用消费品以旧换新;近期将会同有关部门启动实施县域充换电设施补短板工作,挖掘农村新能源汽车消费潜力……

2023年四季度,中央财政增发了1万亿元国债,集中力量支持灾后恢复重建和弥补防灾减灾救灾短板。财政部预算司司长王建凡表示,财政部为此建立了增发国债资金库款单独调拨机制,目前1万亿元已全部调度给地方,确保各地不因资金影响项目建设进度。财政部将指导地方加快推进项目实施,持续抓好增发国债资金监管,确保将宝贵的资金用在刀刃上,努力提高资金使用效益。

《政府工作报告》提出,从今年开始拟连续几年发行超长期特别国债,专项用于国家重大战略实施和重点领域安全能力建设,今年先发行1万亿元。王建凡表示,将根据超长期特别国债项目分配情况,及时启动发行工作。结合债券市场需求和超长期特别国债对应建设项目的实施周期,科学设计发行品种期限。同时,统筹一般国债和特别国债发行,合理安排发行节奏,切实保障特别国债项目资金需求。“未来还将加强中央和地方资金、存量和增量资金统筹,与超长期特别国债资金形成合力,提高资金整体效能。”王建凡说。

编辑:何彩军责任编辑:潘可光