2024-10月
语义分割问题
目前,langchain 和 llamaindex 都缺乏基于语义分割的分片机制,这会导致文本重叠和信息冗余。
解决方案
我计划采用基于语义分割的分片方法,将文本分割成语义完整且独立的块。
与小学三年级的ChatGPT一起学JS编程
心智为9岁的ChatGPT大约相当于我们小学3年级的学生,所以让我们与小学3年级的ChatGPT一起来深入学习编程吧.
下面是对ChatGPT的第一次提问:
你知道吗?编写一个js函数模拟实现 super
访问父类方法的功能有几种方法?
要求:该函数的调用方式要从语法上尽可能的接近原生super
的调用方式,实现尽量简洁明了.
约定该函数名以及函数签名(返回值根据具体实现方式而定)为: getSuper(instance: Object)
每一种方法都必须用该函数签名来实现,并具体说明,哪一种方法从语法上最接近原生super
.
最近这几个月,我一直在断断续续的使用ChatGPT. 并对它有了一些感受,首先感觉就是笨,智力有限,就像一个8、9岁孩子的智商一样;但是另一方面,我发现ChatGPT的知识面非常广泛,它似乎可以对几乎所有的话题都能够做出头头是道的回答。当然ChatGPT同样也是经常犯错,而且错得是一塌糊涂,但是我却从中总感觉到它是在真的在思考.
我不知道它的思考能力到底是从何而来,也很难想象一个“机器”可以像人一样去思考。但我知道ChatGPT是基于Transformer架构的语言模型。在产生回答时,它所依赖的是从大规模的文本语料库中学习得到的统计模式和规律,通过计算预测下一个词汇的概率来生成下一步的预测和生成的结果。
ChatGPT并不是基于真正的自然语言理解和知识图谱技术开发的。在它的“脑子”里并没有可供查询的知识库和推理算法,全是通过模型参数进行预测和生成回答。谁也没想到,这样的方式居然能够推理、解决问题,甚至产生出类似于心智的能力。
注意: 最新HA版本(2022.8以后)的官方蓝牙集成开始直接支持Passive BLE 设备,目前还在移植更多的蓝牙设备.官方蓝牙集成不能与BLE Monitor集成同时工作!请做好选择,官方蓝牙集成同样支持蓝牙网关.
Zigbee2MQTT的低功耗是源于它的低速,但某些场合则要求高带宽,比如IP摄像头
. 而对IP摄像头来说支持 ONVIF(Open Network Video Interface Forum)
协议是必须的,不支持开放网络视频协议的都是在耍流氓,当用户是羊!比如:萤石私有协议,看似可以接入HA,你不知道的是所有的控制都要去他们公司云上绕一圈才回来,为了达到偷窥家庭的目的,特意废弃一贯支持的ONVIF
,搞了萤石私有协议,让他们公司的有权限的人可以随时随地观看场景剧甚至动作片,不旺一番苦心.
忙活了许久,攻克了一个接一个的难关:
眼看我的原型项目就快完成了,结果我栽在了同步上,没错,就是 PouchDB
引以为豪的同步操作,第一次同步没有问题。第二次同步就歇菜,一大堆的冲突错误,但实际上我根本没有增加任何数据,粗步怀疑后续同步必需保存上一次的last_seq
的值,这不科学,万一这玩意弄丢了,那不就再也无法同步到服务器了,这太Low了。我还记得,前面发现一个PouchDB的严重错误:在特定情况下(new_edits=false
)的bulkDocs
函数并不返回操作成功的的数据。然后PouchDB的维护者说,他必需保证和CouchDB的完全一致,CouchDB的Bug也必需在PouchDB完全重现,于是拒绝了我的PR,并关闭了Issue就当bug不存在!这脑洞到底该有多大。给PouchDB缝缝补补也有些时日,算了,累了,趁这个机会换吧,老早想换,因为PouchDB/CouchDB本来就不适合纯P2P(点对点)的存储,也就是人人都是中心的方式,P2P方式更类似于Git
,本来考虑到是原型怎么着都无所谓,做做试验,试水一下,忍忍就过去了,但是,直到今天,再也无法忍了,还是一步到位,直接上Git作为存储。在开搞之前,决定写篇文字放松放松。