"沈娜娜苏清歌团圆火锅",十大机构看后市:大涨之后必有波动保持多头思维,西藏自治区政协原副主席姜杰被提起公诉
"沈娜娜苏清歌团圆火锅",微博观影团《柯南:百万美元的五棱星》抢票,BC时代真正来临?隆基绿能发布HPBC二代分布式新品
"沈娜娜苏清歌团圆火锅",厅级干部跨省份交流任职陆续亮相,多人为“75后”干部
沈娜娜苏清歌团圆火锅说明
马红俊2口爆竹竹清
青柠影院免费高清电影观看
《新金瓶梅3d国语完整版》
小小水蜜桃8在线看
青柠影院手机在线高清免费观看
小小水蜜桃在线观看视频
沈娜娜苏清歌团圆火锅:韩国医疗界将全面罢工,多个医生团体拒绝参加,美国密歇根州一水上乐园发生枪击案致9人受伤,即将卸任的荷兰首相,找好了下一份工作
"沈娜娜苏清歌团圆火锅", 炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会! 来源:华金证券 历史上A股大幅放量后直接下跌的概率较低,主要受政策和外部事件、基本面的影响。复盘1992年以来A股大幅放量大涨后的走势,可以看到:(1)大幅放量后A股表现不一:12次中有6次震荡下跌后上涨,5次震荡上涨后下跌,仅1次直接下跌。(2)政策和外部事件、基本面是影响A股放量大涨后走势的主要因素。一是政策和外部事件是核心影响因素:首先,放量后直接下跌的2007年,主要受大小非减持及海外次贷危机蔓延的影响;其次,放量后震荡上涨再下跌的1993、1994、1996、2013年均是受政策持续收紧的影响;最后,放量后震荡下跌再上涨的1995、2019、2020年均是受货币宽松、稳增长政策落地等政策驱动。二是基本面强弱也对后续市场走势有影响:基本面偏弱则震荡后可能走弱,反之则可能走强。 当前政策依然积极、基本面修复有待验证下A股可能维持震荡走势,中长期牛市行情未完。比照历史复盘,当前A股放量后可能走震荡后再上涨的走势:(1)短期内政策依然积极、外部风险有限。一是政策上,首先,经济政策方面,财政发力等政策大概率出台和落实;其次,资本市场政策方面,央行互换便利工具已经落地实施、取消对高频交易的手续费减收等政策继续出台,政策方向依然积极。二是外部风险上,短期内有限:首先,中美关系短期有改善迹象;其次,美联储短期降息预期下降、伊以冲突等均未对全球资本市场产生明显影响。(2)基本面继续处于修复趋势中,但强度和持续性仍有待验证。一是地产销售仍偏弱,消费继续处于低位修复趋势中;二是工业企业利润增速和全A盈利增速仍处于回升周期中。(3)政策发力导致信用回升从而提升A股估值的中长期逻辑未变,中长期牛市行情未完。 短期震荡,结构性行情延续。(1)分子端:经济和盈利修复趋势不变。一是经济延续修复趋势:高频数据显示基建项目开工持续推进,同时地产周销售同比增速有所回升。二是企业盈利回升趋势不变。(2)流动性:维持宽松。一是美联储11月降息预期下降,但国内货币宽松基调不变。二是融资已大幅回流,后续流入幅度可能下降,但仍维持较高流入水平;外资流入和新发基金均可能持续改善。(3)风险偏好:情绪有所降温,但政策积极仍对风险偏好有支撑。一是外部风险有一定扰动;二是减持等对市场情绪有一定降温;三是政策进一步出台继续支撑风险偏好。 结构性行情下成长占优,短期关注科技成长、核心资产和部分低估值国企。(1)短期科技和部分核心资产依然可能占优。一是历史经验上,大幅放量后周期、消费、科技相对占优;二是当前放量后科技、消费等部分核心资产可能占优。(2)建筑、周期等行业的中部分低估值国企短期也可能有配置机会。一是历史上上涨进入中期阶段后,景气或盈利偏好的行业相对占优;二是当前建筑、周期中的低估值国企受益于三季报和政策可能有配置机会。(3)短期建议继续逢低布局:一是政策和产业趋势向上的电子、通信、计算机、传媒;二是受益于基本面可能低位改善和外资流入的核心资产(电新、医药、消费);三是建筑、周期中的低估值国企。 风险提示:历史经验未来不一定适用、政策超预期变化、经济修复不及预期。海量资讯、精准解读,尽在新浪财经APP
"沈娜娜苏清歌团圆火锅",转自:AI寒武纪大语言模型真的可以推理吗?LLM都是“参数匹配大师”?苹果研究员质疑LLM推理能力,称其“不堪一击”!苹果的研究员MehrdadFarajtabar等人最近发表了一篇论文,对大型语言模型(LLM)的推理能力提出了尖锐的质疑,--**-- 转自:AI 大语言模型真的可以推理吗?LLM都是“参数匹配大师”?苹果研究员质疑LLM推理能力,称其“不堪一击”! 苹果的研究员MehrdadFarajtabar等人最近发表了一篇论文,对大型语言模型(LLM)的推理能力提出了尖锐的质疑,他认为,LLM的“推理”能力,其实只是复杂的模式匹配,不堪一击! 论文作者研究了包括Llama、Phi、Gemma、Mistral等开源模型,以及GPT-4o和o1系列等闭源模型。需要指出的是,在OpenAI发布GSM8K的三年里,模型的性能有了显著提升,从GPT-3(175B)的35%提升到了现在30亿参数模型的85%以上,更大的模型甚至超过了95%。但Farajtabar认为,这并不能证明LLM的推理能力真的提高了 为了测试LLM的数学推理能力的极限,Farajtabar和他的团队开发了一个名为 GSM-Symbolic 的新工具,它可以根据GSM8K测试集创建符号模板,从而能够生成大量实例并设计可控实验。他们生成了50个独特的GSM-Symbolic集合,这些集合本质上就像GSM8K示例,但具有不同的值和名称 GSM8K是“GradeSchoolMath8K”的缩写,是一个用来评估数学问题解决能力的数据集。这个数据集主要包含小学级别的数学题目(大约8,000道题目),通常用于训练和测试机器学习模型,特别是在自然语言处理领域的模型如何处理和解决数学问题 实验结果,令人大跌眼镜: 1.当前GSM8K的准确率并不可靠! 不同模型在GSM8K上的表现差异巨大,例如Llama8B的得分在70%到80%之间,Phi-3的得分在75%到90%之间,等等。对于大多数模型,在GSM-Symbolic上的平均性能低于在GSM8K上的平均性能 2.所谓的LLM推理能力不堪一击! LLM对专有名词和数字的更改非常敏感,这说明它们并没有真正理解数学概念。就像一个小学生,如果我们只是更改了数学测试题中的人名,他的分数就会下降10%吗?显然不会 3.随着问题难度的增加(M1→Symbolic→P1→P2)。引入了GSM-Symbolic的三个新变体来研究模型行为:删除一个分句(GSM-M1)、增加一个分句(GSM-P1)或增加两个分句(GSM-P2),模型的性能下降,方差上升, 这意味着模型的可靠性越来越差 4.引入GSM-NoOp后,模型性能断崖式下跌! GSM-NoOp是在GSM-Symbolic的基础上,添加了一个看似相关但不影响整体推理的子句。所有模型,包括o1模型,都表现出了显著的性能下降。这说明,即使是强大的o1模型,也无法真正理解数学问题的逻辑结构 5.即使是OpenAI的o1系列模型,也无法完全避免这些问题。 o1-preview虽然有所改进,但仍然会犯一些低级错误,例如无法理解“现在”和“去年”的区别,这可能是因为训练数据中包含了“通货膨胀”的模式,模型只是简单地模仿了这种模式 Farajtabar认为,LLM的这些表现,更好地解释是复杂的模式匹配,而不是真正的逻辑推理。 即使我们增加数据、参数和计算量,或者使用更好的训练数据,也只是得到了“更好的模式匹配器”,而不是“更好的推理器” DennyZhou(谷歌DeepMind的LLM推理团队负责人)也参与了讨论,他指出:“这项工作的一个关键发现是:向GSM8k问题添加不相关的上下文会导致LLM无法解决这些问题,正如我们在ICML2023年的论文‘大型语言模型很容易被不相关的上下文分散注意力’中所证明的那样。提示构建的差异在我看来仍然很有趣。” YuandongTian(MetaAI的研究科学家总监)也表达了他的观点:“核心问题是:1??凭借我们的领域知识,我们可以构建权重,使LLM在特定问题中进行良好的推理;2??然而,梯度下降可能无法学习到这样的权重;3??我们仍然依赖梯度下降,因为它为许多领域带来了魔力——如果它在其他领域变得愚蠢,我们也无能为力。” 结论总的来说,这篇论文研究结果没有在包括Llama、Phi、Gemma和Mistral等开源模型,以及最近的OpenAIGPT-4o和o1系列等领先闭源模型在内的语言模型中,找到任何形式推理的证据。他们的行为可以用复杂的模式匹配来更好地解释——如此脆弱,以至于更改名称都会使结果改变约10%!我们可以扩展数据、参数和计算量——或者为Phi-4、Llama-4、GPT-5使用更好的训练数据。但这可能只会产生“更好的模式匹配器”,而不是“更好的推理器”海量资讯、精准解读,尽在新浪财经APP
"沈娜娜苏清歌团圆火锅",
作者:贝天蓝
伊朗外长访问伊拉克,将与伊拉克总统会面
"沈娜娜苏清歌团圆火锅",十大机构看后市:大涨之后必有波动保持多头思维,湖南麻阳一57岁男子被悬赏通缉,村民:致一死一伤,中信证券:财政政策超预期行情将从脉冲式涨跌换挡至企稳慢涨,伊朗外长访问伊拉克,将与伊拉克总统会面,巴基斯坦驻华大使感谢中方帮助巴侨民从苏丹平安撤离
"沈娜娜苏清歌团圆火锅",高盛再谈”AI交易四阶段“:第二阶段“AI基建”已近成熟,第三阶段别看应用
"沈娜娜苏清歌团圆火锅",
总监制:典宝彬
监 制:牛凡凯
主 编:苦得昌
编 审:訾宜凌
(文章未经授权不得转载。)