没再多看论文,反而是打开了证券交易软件,在卡里有几百万的时候他就开通了美股账户,就是为了在这个时间点狠狠地捞一笔。
他把卡里的全部都存到了账户里,一共270万,留下十万块应急。
DS论文的发布在相关研究领域引起了巨大的地震,现在可能还看不出来,但是等过几天之后,反应最为剧烈的就是美股科技板块,
如果他没记错的话大概是27号那一天,纳斯达克指数就跌了3%,而仅仅是英伟达的股价暴跌17%。
这没啥好说的,周昀直接选择直接买入看跌期权,而且是一把梭哈,因为期权的高杠杆性,他能收获好几倍于本金的收益。
他也不贪心,记忆中当日暴跌时17%,他打算看跌14%就好,如果这么算下来,千万级别的收益是轻轻松松的。
也许还有其他更加赚钱的办法,但是他对金融领域并不算太熟悉,这个已经是他能想到的最好办法,也是最快的。
而且有了这笔本金,他就可以参与到之后一波更加疯狂的资本市场。
买完之后周昀就没再管它,只需要等到27号交易结束等着数钱就完了。
在等着收钱的时间里,又一个好消息传来,他投稿ICLR的那篇时间序列研究的文章收到了评分的通知,看分数AC应该是稳了,
不过这次周昀并不打算再去参会,这种经历有一次就够了,如果是为了见什么大佬好像也没什么意义,
毕竟又不可能光凭一面之缘对方就怎么怎么样,而且说是去开会,大部分时间其实都在玩,
他本来就不是一个喜欢旅游的人,偶尔出去一次还行,要是太频繁他宁愿窝在家里看电影或者睡觉。
再说现在网络这么发达,就算不去参会基本也能掌握基本情况。
组里的群聊,邓永华也再次告知了大家这个消息,虽然周昀马上就要博士了,但他还是挂名在邓永华底下的博士生,所以就没有退群。
对此,大家除了恭喜也说不出别的什么了,倒是当时跟着周昀做这个工作的几个同组的人都很高兴,毕竟混了个二作三作,虽然对他们毕业没啥用,但这毕竟是顶会不是?
至此,周昀的履历下面又要多一篇顶会文章了。
而在DeepSeek论文和模型发布之后,在学术界也引起了一场地震。
有人惊讶于其技术带来的极致性价比,不过也有人会发出疑问——代价是什么?
但这都无法阻挡DeepSeek的强势。
也许R1在之后的表现会越来越不如其它的大模型,也会发现有非常非常多的缺点,但在现在这个时间段,它无疑是非常强大的。
米国,斯坦福某实验室,凌晨两点。
正在查论文的博士生Leo看到DS的那篇论文,出于职业素养,他照例点开看了眼摘要。
不过这一看,他瞬间坐直了身体,睡意全无,几乎是脱口而:“Holy *$?!”
虽然是凌晨两点,但是因为他们最近在赶论文,所以实验室里还有不少人,这声惊呼引得旁边还在跑实验的同学投来疑惑的目光。
“Leo,怎么了?代码又出bug了?”
“我倒是希望代码出bug了,看看这篇文章吧。”他将屏幕转动了一下,让其他人能看得清上面的论文题目。
“R1: Redefining Cost-Performance Tradeoffs in Large-Scale Language Models?”
旁边的同学Sarah搜了一下,果然找到了这篇刚刚发布不久的文章。
“这是哪个公司的成果吗?”因为作者的名单上长长一串一般只有公司的文章才会这样。
“就是DeepSeek,之前他们不是发过一个V3版本的论文吗?当时老板还让我们看过,你不记得了?”
“哦~好像有点印象,怎么,这篇R1有很大的提升吗?”他一边说着一边看向下面的摘要部分。
“Reinforcement learning(强化学习)?这不是和我们现在做的方向一样吗?”不过当他看到第一张图片的时候不由得歪了歪脑袋,发出了同样的惊呼:“Holy*$?真的假的?”
图片上面显示了,其效果几乎和GPT-o1持平,而且文中写到了其推理成本的二十分之一还不到。
Leo苦笑着摇头“不知道,我希望是假的,但我感觉应该是真的。”
搞科研最为悲伤的事情之一——你有了一个很好的idea,并且已经做了一段时间,就在快要有成果的时候,却发现人家已经做出来了,而且比自己做的更好。
好消息:LLM有了新的突破,坏消息:你论文白写了。
“哎~没办法,我再看看吧,如果是真的,估计老板肯定会要求我们复现的。”
“说的也是。”
和他们一样反应还有很多人,公司的工程师们,高校的学生老师,对搞科研的人来说熬夜是常态,所以哪怕论文是在夜里发的也有很多人看到了这篇文章。
仅仅是论文发布后的第二天,各个视频网站或者学术论坛上就涌现出了不少针对R1的解读。
之后几天,随着不断有人成功复现出DeepSeek,谷歌、Meta等大厂的AI部门负责人连夜召集紧急会议。
因为DeepSeek的低成本将有可能会直接威胁到所有依赖高收费模式的云服务和AI公司的盈利预期。
很快,市场上谣言四起,比如什么多家云服务提供商正在紧急重新谈判未来的GPU采购合同,规模可能大幅缩减。
这一类的传言难辨真假,这就导致了在极度敏感和恐慌的市场情绪下,成为了压垮骆驼的最后一根稻草。
DeepSeek的成功让资本市场看到了开发成本较低的强大AI模型的可能性。
27号,正好是周一,美股开盘。
周昀提前候在电脑面前,两块屏幕,一块屏幕放着电影,另一块屏幕显示着英伟达的股价。
桌上还摆着一盘小零食,他盘着腿靠在椅子上,巴适的很。
和记忆中新闻报道的一样,刚一开盘Nvidia就以无可匹敌之势一路下探,除此之外,其他芯片股也集体大跌。
周昀吃着零食笑呵呵地看着下跌的股价,心里冒出一个念头,也不知道老黄现在是个什么表情。
反正他的嘴角是真的难压。
他把卡里的全部都存到了账户里,一共270万,留下十万块应急。
DS论文的发布在相关研究领域引起了巨大的地震,现在可能还看不出来,但是等过几天之后,反应最为剧烈的就是美股科技板块,
如果他没记错的话大概是27号那一天,纳斯达克指数就跌了3%,而仅仅是英伟达的股价暴跌17%。
这没啥好说的,周昀直接选择直接买入看跌期权,而且是一把梭哈,因为期权的高杠杆性,他能收获好几倍于本金的收益。
他也不贪心,记忆中当日暴跌时17%,他打算看跌14%就好,如果这么算下来,千万级别的收益是轻轻松松的。
也许还有其他更加赚钱的办法,但是他对金融领域并不算太熟悉,这个已经是他能想到的最好办法,也是最快的。
而且有了这笔本金,他就可以参与到之后一波更加疯狂的资本市场。
买完之后周昀就没再管它,只需要等到27号交易结束等着数钱就完了。
在等着收钱的时间里,又一个好消息传来,他投稿ICLR的那篇时间序列研究的文章收到了评分的通知,看分数AC应该是稳了,
不过这次周昀并不打算再去参会,这种经历有一次就够了,如果是为了见什么大佬好像也没什么意义,
毕竟又不可能光凭一面之缘对方就怎么怎么样,而且说是去开会,大部分时间其实都在玩,
他本来就不是一个喜欢旅游的人,偶尔出去一次还行,要是太频繁他宁愿窝在家里看电影或者睡觉。
再说现在网络这么发达,就算不去参会基本也能掌握基本情况。
组里的群聊,邓永华也再次告知了大家这个消息,虽然周昀马上就要博士了,但他还是挂名在邓永华底下的博士生,所以就没有退群。
对此,大家除了恭喜也说不出别的什么了,倒是当时跟着周昀做这个工作的几个同组的人都很高兴,毕竟混了个二作三作,虽然对他们毕业没啥用,但这毕竟是顶会不是?
至此,周昀的履历下面又要多一篇顶会文章了。
而在DeepSeek论文和模型发布之后,在学术界也引起了一场地震。
有人惊讶于其技术带来的极致性价比,不过也有人会发出疑问——代价是什么?
但这都无法阻挡DeepSeek的强势。
也许R1在之后的表现会越来越不如其它的大模型,也会发现有非常非常多的缺点,但在现在这个时间段,它无疑是非常强大的。
米国,斯坦福某实验室,凌晨两点。
正在查论文的博士生Leo看到DS的那篇论文,出于职业素养,他照例点开看了眼摘要。
不过这一看,他瞬间坐直了身体,睡意全无,几乎是脱口而:“Holy *$?!”
虽然是凌晨两点,但是因为他们最近在赶论文,所以实验室里还有不少人,这声惊呼引得旁边还在跑实验的同学投来疑惑的目光。
“Leo,怎么了?代码又出bug了?”
“我倒是希望代码出bug了,看看这篇文章吧。”他将屏幕转动了一下,让其他人能看得清上面的论文题目。
“R1: Redefining Cost-Performance Tradeoffs in Large-Scale Language Models?”
旁边的同学Sarah搜了一下,果然找到了这篇刚刚发布不久的文章。
“这是哪个公司的成果吗?”因为作者的名单上长长一串一般只有公司的文章才会这样。
“就是DeepSeek,之前他们不是发过一个V3版本的论文吗?当时老板还让我们看过,你不记得了?”
“哦~好像有点印象,怎么,这篇R1有很大的提升吗?”他一边说着一边看向下面的摘要部分。
“Reinforcement learning(强化学习)?这不是和我们现在做的方向一样吗?”不过当他看到第一张图片的时候不由得歪了歪脑袋,发出了同样的惊呼:“Holy*$?真的假的?”
图片上面显示了,其效果几乎和GPT-o1持平,而且文中写到了其推理成本的二十分之一还不到。
Leo苦笑着摇头“不知道,我希望是假的,但我感觉应该是真的。”
搞科研最为悲伤的事情之一——你有了一个很好的idea,并且已经做了一段时间,就在快要有成果的时候,却发现人家已经做出来了,而且比自己做的更好。
好消息:LLM有了新的突破,坏消息:你论文白写了。
“哎~没办法,我再看看吧,如果是真的,估计老板肯定会要求我们复现的。”
“说的也是。”
和他们一样反应还有很多人,公司的工程师们,高校的学生老师,对搞科研的人来说熬夜是常态,所以哪怕论文是在夜里发的也有很多人看到了这篇文章。
仅仅是论文发布后的第二天,各个视频网站或者学术论坛上就涌现出了不少针对R1的解读。
之后几天,随着不断有人成功复现出DeepSeek,谷歌、Meta等大厂的AI部门负责人连夜召集紧急会议。
因为DeepSeek的低成本将有可能会直接威胁到所有依赖高收费模式的云服务和AI公司的盈利预期。
很快,市场上谣言四起,比如什么多家云服务提供商正在紧急重新谈判未来的GPU采购合同,规模可能大幅缩减。
这一类的传言难辨真假,这就导致了在极度敏感和恐慌的市场情绪下,成为了压垮骆驼的最后一根稻草。
DeepSeek的成功让资本市场看到了开发成本较低的强大AI模型的可能性。
27号,正好是周一,美股开盘。
周昀提前候在电脑面前,两块屏幕,一块屏幕放着电影,另一块屏幕显示着英伟达的股价。
桌上还摆着一盘小零食,他盘着腿靠在椅子上,巴适的很。
和记忆中新闻报道的一样,刚一开盘Nvidia就以无可匹敌之势一路下探,除此之外,其他芯片股也集体大跌。
周昀吃着零食笑呵呵地看着下跌的股价,心里冒出一个念头,也不知道老黄现在是个什么表情。
反正他的嘴角是真的难压。