首页 >> 中医刮痧

年度征文 | 卡片笔记太多,回忆不起来?快用机器学习帮你自动找寻关联

发布时间:2025年09月22日 12:17

>

周五晚合桃人马播送便,我拿着这个疑惑,跟刘丹代课闲聊了闲聊。他写到《明信片取而代之序言撰写成依此》之中最主要的一个缺失,就是这内都有一个意味着的彻底改变反复。如果不来进行定期彻底改变,你理论上上就则会想起之当年据信的显然,无依此把良远的可考与取而代之的取而代之序言理论上绑定大大的。可是序言的所作 Sönke Ahrens 似乎内化了这种彻底改变作依此,并不能特别强调。

曰止是不能特别强调啊,Sönke 在文之中必要提显露,他不认同 ANKI 间隔梦境的作依此。

Sönke 对 ANKI 负面认为这个没事,我不知过《明信片取而代之序言撰写成依此》的译者陈琳。他实在对于明信片取而代之序言来知道,近似于 ANKI 的彻底改变是很适当的。虽然他在译者的时候忠于原作,但是序言之中对 ANKI 的评论他不认同。

刘丹代课现有在合桃人马拿着大家好好 30 天明信片据信的特训营,「合桃人马」影片号内都有网页入口。他在试着把 Supermemo 这样的 SRS (间隔梦境该系统)带进到明信片的据信与彻底改变之中,希望大家形成彻底改变取而代之序言的惯用,让明信片取而代之序言该系统得以也就是知道运转。

刘丹代课知道,大多数人一旦形成了惯用,很多困境(例如撰写成障碍、拖延症)都迎刃而解。关单键是要扫清障碍,尽早迈显露第一步。

我俩在交流之中,各自谈论述「于是就」的记事,愈发投缘,哈哈。

不过若是比「多时会」,我实在自己极其突显露一些。刘丹代课所好好的,还是潜移默化希望你构建惯用;而我则希望非常进一步,让你不必作显露改变,也能把「于是就」来进行到底。

换句话知道,有不能非常低品质作依此,彻底解决远期明信片的彻底改变和通到呢?

这个当然可以有。因为我们有计算机科学嘛。

很多人揶揄,知道今日的「计算机科学」不如叫好好「人工老年人」。对于机械好好的很多事,都不屑一顾。

但我不是这样看。现有机械虽不具备强计算机科学,可在某些特定各个领域,其实把人类这种碳基微生物甩得显然的。

不服?你去和 AlaphaGo 下盘围棋不曾用。

我这前言的草稿,是对着 Roam Research 内都明信片木料的纲要,用语音类比成理论上该系统类比手写转化成,识别率很低。背后就是计算机科学数学模型。

我今日好好影片仍未不用绿幕了,嫌麻烦。不对找个背景录制便,机械理论上该系统影片抠像。效果虽然不必知道令人难忘,但是我实在够用。不能信息归纳,这显然无依此意味着。

我在课上展示几种相同大型猫科动物的幻灯片,让学生来判断。他们判断效果还好, 能错1/3,甚至一半儿。都只的弊端,寄给迁移学习特训显露来的机械数学模型,权重都在 99% 以上。

就连当是试的时候,不并不需要你偷偷地通讯设备,不也是怕你进预设吗?别人当是英语译者;也凭梦境搜肠刮肚,你这边进个 OCR + DeepL ,那曰不成了碾压?

创作经验不是一场当是试。我们某种程度把所有能进的预设,都给它进进。

让机械三人忙找回就其的表达方式显然,实际上并不是什么取而代之的该系统。Devonthink 就有。

我第一次获悉 DEVONthink,就是看见万维GUNDAM代课这段手写:

有机体造就体现力不可忽视的一个手段,就是把两个相同的就让依此通到大大的。这个通到越多是意就让差不多,体现显露来的过道就也许越多倒是。就让要让就让依此通到,你得先包括很多很多就让依此可不,而今日你可以把就让依此交与在一个外部理论上该系统内都,让数值机三人你设立通到! ……DEVONthink,只用非常复杂的算依此提供非常多的就其显然,而且还有假设的就其度评估。

不过 DEVONthink 非常精于直译的就其度评估。之中文处置上,尽管 3.x 旧版仍未有了显著提升,却还有待基础上。

我于是就就让,干脆把 DEVONthink 的手写比如知道度数值,必要迁移到 Roam Research 上,不就好了?

目标有了,实际上彻底解决大大的非常直观。这几年,我的信息分析之前跟计算机科学惯于。

表达方式处置各个领域,现有信息分析显露的 Transformer 数学模型是越多来越多大。咱们与生俱来应用于,杀鸡焉用牛刀。 GPT-3 这种规模的数学模型就别用了,抱怨。我必要拿一个几年当年的 BERT 根基款数学模型,就把这没事干了。

方依此很直观。BERT 数学模型可以吃进手写,突显露一串进制(formula_)来表示它。我们只须要测定两串进制的比如知道程度,就能判断两个类比成手写彼此之间的关连性度。

用 BERT 的好处,主要在于表列显露两个全面性:

第一,见多识广。BERT 特训的时候,转用了大量的语料,因此大多的通用词,都认得;

第二,无需预处置。什么分词、停用词查表、语序、词性…… 全都不用咱们其他用户当是虑,直观卑劣。

靠着这俩占优,撰写显露来的机制也是短小精悍。

为了把理论上该系统的不非对称占优来进行到底,我顺拿着还用 Streamlit 只用了个 Web 运用于。

你看,这是试运行便的理论上GUI。

你把最取而代之的一则取而代之序言,放到最上方的手写类比成栏内都,然后示意图 3 个类比成框,提供一些追踪的极少限于。

第一个类比成框,是网页的白名单。

假如你爱好把一直取而代之序言都叫好好 #evergreen ,那么就可以把这个标记放到其之中。我不爱好 #evergreen ,因为有点长,多时会得敲打那么多字儿。于是我用的是 #zk 。

我这内都都有的意味着网页列表都是依照自己应用于惯用增设的,逗号重叠。其之中甚至还包括一些 Readwise 理论上该系统导入的 Highlights ,以及 Cubox 绑定。这样一来,即便你本来低亮的时候不能好好任何批注和彻底改变,它也依然则会因为低完全相同度关连性过来。这样你再也不用漫无目的地彻底改变所有取而代之序言,而是以「类比成取而代之的取而代之序言显然」作为触发,反思完全相同的良远梦境。

第二个类比成框,是网页的暗名单。

我平时就把日记都放于 Roam Research 内都,信息库的时候我不希望这些显然进来捣乱,必要通过网页排除掉下来它们才可。

第三个类比成框,是你主动信息库的肽单键接。

须要扩大追踪极少限于,不受限上述网页涵盖显然时,你可以用这些肽单键接伸显露「把手」,把全库之中都有这个肽单键接的所有取而代之序言(block)都「捞进来」一齐归纳。

这个值得注意内都,我这内都当是虑意味着的作依此,不扩展肽单键接。

好了,点一下 start ,进始执行。

因为线程 Transformer 数学模型还是须要一些星期上的进销的。所以机制首先归纳并且提示,这一轮你取而代之申请延入了多再加条取而代之序言作为候选。

如果你看见进制过大,也许须要当是虑重取而代之修正一下过滤器的增设。不然为了看结果,也许得等上短星期了。

确认要执行,页面一下 「Just do it」 操纵杆就行了。

至再加 50 条取而代之显然申请延入,归纳反复大概停滞 30 多秒。警惕我好好的这个运用于有缓存机制。你这一轮仍未归纳过的明信片(block)显然,再多归纳的时候,就不须要额外花星期线程 BERT 数学模型处置了。换句话知道,你用越多快良,这个理论上该系统执行速度就越多快。极佳吧?

如上图所示,结果提供的是一个释义。这个释义内都,Roam Research 内都的 block id 作为单键(key),而q(value)是完全相同的块手写显然。

从结果来看,筛选显露来的显然就其度挺低。

这个理论上该系统并非必要希望你去设立绑定,而是给你找回一些候选明信片,由你自行决定前提通到大大的。绑定方依此很直观,block id 都在这内都呢,复制过来延两个括号(例如本例之中((71qLjxnbS))),就设立块绑定了,对吧?这样保证了取而代之序言彼此之间细粒度的关连性。

便我换一段显然类比成,这次是发展史就其显然,谈论「爱新觉罗」的可考。

你则会看见,信息库显露来的就其显然,构图来不及为之一变。

结果大多都是我平时学习者并且同步到 Readwise 内都的「发展史」主旨显然。可见,本运用于基于 BERT 语依此比如知道度的数值,显然不必根据类比成手写的特质,钩沉相同类别的明信片显然。

警惕这内都归纳的对象,并非必要调取 Roam Research 信息库。不间断一星期,Github Actions 则给与我理论上该系统非常取而代之推 Roam JSON 副本。我就是用这个之前非常取而代之的 JSON 副本好好归纳。

为什么不必要归纳 Roam Research 信息库呢?因为不曾适当。我每天重度应用于 Roam Research ,这个信息本身,就是不停变异的,读取的时候须要当是虑有点多显然。而型式 JSON 副本,归纳大大的要直观很多。不抄近道儿,还已是多时会人吗?

这样归纳型式的显然,则会不则会有该系统全无?

我实在不则会。

因为你要关连性的,是星期上的远距离据信,是你大概率仍未就让的以外明信片。我就让,你还不至于把一个星期之内撰写的过道,都想起了吧?

对于 Roam Research 来知道,只当是虑手写语依此完全相同度,图信息库的现实冲击力还显然不能造就显露来。下一步,某种程度连偷偷地块举显露密切相关的螺旋形,好好图信息归纳(Graph Machine Learning)。但是,比起人工强制性定期彻底改变明信片,这种基于表达方式处置数学模型的理论上该系统化专用作依此,仍未往当年迈进了一大步。

谈论到这内都,有人也许又要进暗了。什么「机械精准度差不多百分之百,勉强好好个参当是」,「关单键还得看人的潜能」云云。

这些无趣一点儿也不取而代之鲜。仍未有总有人宣传「理论上该系统无用论」,知道什么不可忽视的是睿智,而不是方依此,非常不是理论上该系统。

这话我首肯一半。这一半,就是睿智的不可或缺性。不曾办依此,老天爷并不能给每一与生俱来大为相同的IQ。玻尔那脑子,在专利局当科科长,也遮掩拼命Light。

但是,理论上该系统不只用吗?

近视的人,可以通过戴眼镜来矫正视力。

不则会四则口算的收银员,也可以按数值器来给显露适当结果。

你从三岁苦练,学了一身「武当断魂枪械」的上乘显露神入化。我手无缚鸡之力,但是手内都端着把上膛的步枪械,你也得忌惮三分不是?

都赛博格一时期了,为什么还有人无视该系统设计与理论上该系统的冲击力,甚至公进倡导「理论上该系统无用论」呢?

因为该系统设计和理论上该系统的不断进步,已成了以外人譬如说的占优,甚至抵消掉下来先天的期望,让他们不能了可以炫耀的资本。

他们寒窗自修很多年,才能方便使用学习者直译文献。

你往IE内都装了个的软件,直译文献不停变成了之中文,看得津津有味。

他们拍出置了无数胶卷,才知道如何处置摄像的清晰度,获得工程技术的萤幕上质感。

你必要借给个 iPhone 13 Pro,胳膊手来就拍出得像大片。

换位探究一下,他们的气能顺吗?

他们徒劳地低声,试图把人们拉返回那样一个不必代价低昂成本才能大为收成的一时期。这样他们譬如说的占优,才能显露显露来;他们代价过的安心,才不能白费。如果你不能那样的体现力,又不乐意代价都只的安心,他们能本站在鄙视肽单键的低处,笑着正中央你。

我能阐释他们的心境,但是不附和他们的好好依此。「理论上该系统无用论」的大力倡导,则会给很多经验行政的学习者,偷偷地来不适当的心智负担,甚至引入迷途。

经验体现的目的,不是为了勋章,而是为了实现好奇心,为了把世界极其非常美丽一点儿。

某种程度「万类霜天竞自由」,而不是所有微生物一齐去比爬树。这才是跳显露内卷的理论上作依此。

这些低声「理论上该系统无用论」的人,显露远门儿也乐意顺道低铁。交通理论上该系统也是理论上该系统,他咋不回头着去呢?

如果你也是个多时会人,恳请相信 ——「多时会」是我们的特点,不是一种罪错。理论上该系统如果能让我灵活性非常低,我就充分应用于,不需有实在的负罪感。

只是警惕「以物养己」,而不想「以物役己」,就好。

我好好的这个计算机科学专用明信片彻底改变理论上该系统,你就让不就让不曾用?

我用 Streamlit 的 Cloud Sharing 该系统,好好了一个局域网服务演示旧版。恳请你访不知这个绑定,才可执行。

这内都我提供了一个 demo.json 副本,都有了我自己面世的 6 前言,作为样例。

你可以试着改撰写几次取而代之类比成显然,是不是运用于分别则会给你该该系统哪些明信片。

如果你就让试着自己的 Roam JSON,恳请私信联系我,并提供事例:

你的样例 Roam JSON 副本。内都至再加还包括 3 个相同正向主旨,每个 5 个 block,每个 block 网页恳请打上 #zk 印有,block 显然不想有每一次; 你就让类比成的几条取而代之取而代之序言显然,同样分别指向相同的主旨正向。总长度不限; 你的邮箱URL。

恳请你把这些显然放到百度网盘或者 notion 网页,然后通过把绑定与生俱来给我。如果你的信息通过了我的本地次测试,我则会把并不需要浏览自己 JSON 旧版的运用于绑定URL发给你。你就可以自己操作者,在此便应用于了。

因为旁观者众多,而 Streamlit Share 和平台比方知道潜能极少。我该该系统联系到当年10名旁观者后,本次测试理论上该系统终止,不再拖延时间取而代之邮件。如果你的样例信息基底有弊端,本地次测试不能通过,振不必给你拖延时间邮件具体表述情况。敬恳请察觉。

次测试落幕并迭代基础上后,我则会面世一个公进的局域网服务旧版,以及相应的源代码。

警惕传给我的显然,和在此之后浏览到运用于的显然,不想还包括任何与生俱来信息的资讯。

给你知道一个我的自觉。当年几天我在播送内都,谈论如何用 Telegroam 的软件移动端类比成显然到 Roam Research 。因为写到了我自己设立的机械(bot)英文名称,Roam Research 内都,就显露现了示意图这些 block 。让我哭笑不得。

这显然是影迷不能按照流程操作者去设立自己的机械,而是必要在我的机械这儿试上了。害得我回来关停掉下来这条类比成路径,重取而代之设立了取而代之的机械。

所以你看,与生俱来信息受保护一定得警惕啊。

我好好的这个小运用于,只是抛砖引玉。希望非常多的双肽单键取而代之序言理论上该系统,能把这样的计算机科学专用该系统附延复刻进来。让其他用户(还包括你我)记取而代之序言的时候再加一些顾虑,联就让的时候多一些影迷们。

尊师取而代之序言愉快!

本文参与「再加数人马 2021 铜奖有奖」社区活动。如果你实在本文有用,恳请三人我「加压」投一票。再见!

如果本文也许对你的朋友们有希望,恳请转发给他们。

欢迎关切我的时事评论「科研成果实是」,以便马上接获在此之后的非常取而代之显然。

延伸学习者

> iTunes再加数人马 、关切 ,找进制一时期非常低的孤独作依此 🎊

> 铜奖彻底改变、好物提拔…… 非常多精彩尽在 🎉

© 本文著作权归所作所有,并专利权再加数人马完全免费应用于,并不需要再加数人马许可,不得刊登应用于。

合肥白癜风医院哪家比较专业
北京好的妇科专科医院
北京比较好的白癜风医院
长沙看牛皮癣到哪家医院
海南白癜风医院哪家正规
喉咙痒一直咳嗽不停怎么办
消化系统肿瘤
痛经的原因
风热感冒咳嗽有痰吃什么药
搜疾病问医生

上一篇: 一揽子加税降费政策加速落地:企业幸福感获得感更好

下一篇: 车上也有“月票”了!12306有售

友情链接