0%

2024-10月

语义分割问题

目前,langchain 和 llamaindex 都缺乏基于语义分割的分片机制,这会导致文本重叠和信息冗余。

解决方案

我计划采用基于语义分割的分片方法,将文本分割成语义完整且独立的块。

阅读全文 »

提示词并非魔法,而是可以被解析”咒语“

引言

当谈及使用大型语言模型(LLM)时,许多人常将其比作神秘莫测的“魔法”。这样的看法固然有趣,但其实它限制了我们探索其真正潜力的机会。想象一下,如果你把一台超级计算机视为施魔法的巫师,那么你可能会永远困惑于它何时能施展奇迹。✨

实际上,与其视其为魔法,不如将其比作一种精妙的“咒语”艺术——沟通的艺术。🤝

当我们将LLM的提示词视为魔法时,它们便成了难以捉摸的神秘力量,我们无法预测它们何时能精准命中目标,何时又会失之交臂。🤔 就像一个不善于表达的孩子,我们无法知道他们想要什么,只能不停地尝试不同的“魔法”直到找到合适的答案。

阅读全文 »

与小学三年级的ChatGPT一起学JS编程

心智为9岁的ChatGPT大约相当于我们小学3年级的学生,所以让我们与小学3年级的ChatGPT一起来深入学习编程吧.

下面是对ChatGPT的第一次提问:

你知道吗?编写一个js函数模拟实现 super 访问父类方法的功能有几种方法?

要求:该函数的调用方式要从语法上尽可能的接近原生super的调用方式,实现尽量简洁明了.
约定该函数名以及函数签名(返回值根据具体实现方式而定)为: getSuper(instance: Object)
每一种方法都必须用该函数签名来实现,并具体说明,哪一种方法从语法上最接近原生super.

阅读全文 »

我看 ChatGPT:人类在作死还是在创造"生命"

我的感受

最近这几个月,我一直在断断续续的使用ChatGPT. 并对它有了一些感受,首先感觉就是笨,智力有限,就像一个8、9岁孩子的智商一样;但是另一方面,我发现ChatGPT的知识面非常广泛,它似乎可以对几乎所有的话题都能够做出头头是道的回答。当然ChatGPT同样也是经常犯错,而且错得是一塌糊涂,但是我却从中总感觉到它是在真的在思考.

我不知道它的思考能力到底是从何而来,也很难想象一个“机器”可以像人一样去思考。但我知道ChatGPT是基于Transformer架构的语言模型。在产生回答时,它所依赖的是从大规模的文本语料库中学习得到的统计模式和规律,通过计算预测下一个词汇的概率来生成下一步的预测和生成的结果。

ChatGPT并不是基于真正的自然语言理解和知识图谱技术开发的。在它的“脑子”里并没有可供查询的知识库和推理算法,全是通过模型参数进行预测和生成回答。谁也没想到,这样的方式居然能够推理、解决问题,甚至产生出类似于心智的能力。

阅读全文 »

智能家居硬件采购避坑指要(四) HA盒子

HA是跑在PC上还是盒子里,这是个问题!

  • PC性能远远强于盒子: CPU主频高(至少都是2G以上)核心多(8-16Cores),内存足(16G-64G),硬盘大
  • PC的功耗也远高于盒子,盒子功耗低

因此如果不在乎功耗和硬盘损耗,以及能够保持24小时开机(不能离线),无脑PC即可.

PC的问题

阅读全文 »

智能家居硬件采购避坑指要(三) 蓝牙设备

蓝牙特性

  1. 短距离通信:蓝牙技术的通信范围通常为10米以内
  2. 蓝牙信号穿墙能力有限,除非你购买BLE蓝牙网关中继设备,而且更容易受到干扰,尤其是不带自动跳频的蓝牙.
  3. 能耗相对较低:因为低功耗蓝牙设备在省电上还是比不过Zigbee设备,BLE蓝牙5.0在省电上与zigbee很接近了.
    • 因此: 为了省电,米家的温度传感器(LYWSD03MMC)是大约10分钟发送一次数据,如果不刷第三方固件,想与空调联动就不要想了.
  4. 简单易用:智能家居蓝牙设备使用普及度高的蓝牙协议,用户不需要额外的网关或路由器即可连接和控制设备
  5. 目前蓝牙协议大多数是私有协议,互通性较差,HA无法直接控制,只有少量的特定厂家的低功耗蓝牙传感设备才能通过第三方Passive BLE Monitor 集成 直接接入HA,支持的设备详见下方的支持列表.
  6. 价格便宜:由于蓝牙技术在手机和其他消费电子设备上得到广泛应用,智能家居蓝牙设备的成本相对较低。

第三方Passive BLE Monitor 集成

注意: 最新HA版本(2022.8以后)的官方蓝牙集成开始直接支持Passive BLE 设备,目前还在移植更多的蓝牙设备.官方蓝牙集成不能与BLE Monitor集成同时工作!请做好选择,官方蓝牙集成同样支持蓝牙网关.

阅读全文 »

智能家居硬件采购避坑指要(二) Wifi设备

Wifi 特性

  1. 穿墙性能好(与Zigbee和蓝牙相比)
  2. 高带宽(与Zigbee和蓝牙相比)
  3. Wifi模块便宜
  4. 需要考虑路由器的带机量,一般家用路由器的带机量都不大.
  5. 最好选择直接供电(非电池)的Wifi设备,避免频繁更换电池的麻烦

Zigbee2MQTT的低功耗是源于它的低速,但某些场合则要求高带宽,比如IP摄像头. 而对IP摄像头来说支持 ONVIF(Open Network Video Interface Forum) 协议是必须的,不支持开放网络视频协议的都是在耍流氓,当用户是羊!比如:萤石私有协议,看似可以接入HA,你不知道的是所有的控制都要去他们公司云上绕一圈才回来,为了达到偷窥家庭的目的,特意废弃一贯支持的ONVIF,搞了萤石私有协议,让他们公司的有权限的人可以随时随地观看场景剧甚至动作片,不旺一番苦心.

阅读全文 »

全屋智能还是全无智能,智能产品还是智障"产品"(服务)

要注意区分产品和服务,产品才是自己的,服务是别人的,是可以随时改变条款的. 不要花大价钱,买回一堆服务.

一点废话

现在越来越多"智能"产品,都要求注册/登陆后才能使用, 这不荒唐么,这是什么产品,还是服务?

听上去全屋智能高达上,其实只是是换了个词忽悠.你兴匆匆的东看看西看看,这家这个不错,便宜;那家那个功能强,都提全屋智能了,那还不赶紧随便挑.
嘿嘿,那你就想错了,各家是各家的,各家设备彼此是无法直接沟通的,没有互联互通,谈不上智能,唯有智障,弄一大堆按钮铺满在手机上遥控就是智能?

阅读全文 »

网摘与知识笔记杂弹

前言

忙活了许久,攻克了一个接一个的难关:

  • Offline first with P2P
  • 离线(本机)人机对话界面:尝试取代信息配置界面(目前还是需要二者结合)
  • 钥匙链的构造规范
  • 钥匙对(数字印章)代替注册与登录
  • 公开数据的加密与签名规范与实施(部分)
  • P2P数据存储与管理
  • 基于矢量图(可无极缩放)的家谱树
  • 离线(本机)人工智能识别人脸与身体
  • 简易动画相片编辑器(自动移位、缩放动画到人脸或者指定位置)

眼看我的原型项目就快完成了,结果我栽在了同步上,没错,就是 PouchDB 引以为豪的同步操作,第一次同步没有问题。第二次同步就歇菜,一大堆的冲突错误,但实际上我根本没有增加任何数据,粗步怀疑后续同步必需保存上一次的last_seq的值,这不科学,万一这玩意弄丢了,那不就再也无法同步到服务器了,这太Low了。我还记得,前面发现一个PouchDB的严重错误:在特定情况下(new_edits=false)的bulkDocs函数并不返回操作成功的的数据。然后PouchDB的维护者说,他必需保证和CouchDB的完全一致,CouchDB的Bug也必需在PouchDB完全重现,于是拒绝了我的PR,并关闭了Issue就当bug不存在!这脑洞到底该有多大。给PouchDB缝缝补补也有些时日,算了,累了,趁这个机会换吧,老早想换,因为PouchDB/CouchDB本来就不适合纯P2P(点对点)的存储,也就是人人都是中心的方式,P2P方式更类似于Git,本来考虑到是原型怎么着都无所谓,做做试验,试水一下,忍忍就过去了,但是,直到今天,再也无法忍了,还是一步到位,直接上Git作为存储。在开搞之前,决定写篇文字放松放松。

阅读全文 »