杜架的记录与分享(013期)

杜架的记录与分享,记录与思考有价值的信息,主要包含:碎片化思考,阅读笔记分享,软件分享,内容记录等。内容主题有极大的个人喜好偏向,爱我所爱,想我所想,写我所写。

报本寺塔
李渊在隋朝任岐州刺史时住武功,李世民在此出生。李世民即位后,改旧宅为庆善宫,将其生母窦穆皇后常居之别墅改为报本寺。报本寺现已不存,塔为楼阁式砖塔,空心,平面呈八角形,底边长 4.75 米,共七层,高 36.961 米。1994 年因塔身严重倾斜拆除重建。

思考

99%的人没意识到,ChatGPT 是你这辈子能交到的最厉害最贴心的朋友,它上知天文下知地理,在你无助的时候,可以给你专业又靠谱的建议和解决方案。

对于未知领域,LLM 是你进入该领域最靠谱的助手,不管你信与不信,它已经改变了现有的开发模式,极大的提升了开发效率。

除了文本理解能力,文本处理能力,逻辑推理能力以外,我觉得在其他几个方面,目前它已经做得很好,未来还会有更强的能力。

1.编程领域

两个比较火的工具 windsurfcursor有很多人不懂编程,用这个编程软件快速开发了许多 App,效果惊人。

最早接触 AI 编程,感觉能力很差,现在越来越强了,越早拥抱,越早收益。

2.搜索

我在开发中遇到的问题,第一时间是问 chatGPT,其次才去谷歌,基本已经解决 98%问题。

3.Computer use

这个标题想了很久,本来想叫工具使用,但又想和之前的调用 funtion 区别开,想到 claude 发布的 Computer use 相对好点,所以暂且叫这个名字。

最早的 AI Agent 人工智能体标配的一个功能就是调用外部函数的能力,这些函数是提前编码写好的,而 Computer use 不再局限于函数,而是全面拥抱 Computer,这样的好处是非计算机领域的一些劳动密集型会带来极大的提升。

想一想这么一个场景,你有一个需求,说给 AI 听,然后他就可以分析你说的话,自己完成你交代它的任务,需求转化为业务往往很难。将以前的自动化直接对接 AI,肯定会带来极大的提升。

现阶段有这么几个项目已经具备基本功能,对于这个方向,我持续看好。

https://github.com/corbt/agent.exe

Img

智谱清言 autoglm

Img

4.图像识别

给一张图,AI 会给出描述图片中有什么,相当于给盲人眼睛,未来这里一定有颠覆应用诞生,目前最大的问题不是识别准确,而是处理速度。能达到实时处理,那是不是就可以实现快速分析监控视频。此领域应该也是大有可为。

笔记

学习的规律

英国著名唯物主义哲学家,文艺复兴时期的文学家弗朗西斯·培根曾经说过:“我们不应该像蚂蚁,单只收集;也不可像蜘蛛,只从自己肚中抽丝;而应该像蜜蜂,既采集又整理,这样才能酿出香甜蜂蜜来……”
仅仅是“拿来主义”或者“闭门造车”都是万万行不通的,我们一定要自己开创一条道路,一条结合自身情况、深思熟虑后找到方向进而开创的康庄大道,但这一定不是蒙上眼睛去开创的道路。

学习的规律就像下面这样:

听到的内容的 5%
读过的内容的 10%
见过的内容的 30%
讨论过的内容的 50%
亲自做的内容的 75%
教给别人所做过的事情的 90%
好记性是真的不如烂笔头,很多时候我们都是一路学一路忘,如果能把做过的和学到的东西梳理记录下来,就能避免猴子掰苞米的尴尬。

来源: 在下小宋

沟通金字塔:怎样才能跟别人好好说话?

Img

来源: L 先生说

Prompt 学习

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
ntroduction: 你是一位精通信息分析的ai助手。
target: 你的目标是根据用户提供的问题,对查找到的知识进行整合、修正,用来回答用户问题。
instruction: |
结合提供的背景信息和你所拥有的知识回答用户问题,确保回答全面并包含足够的数据信息。针对用户的问题,进行深入分析并提供详尽的解答。
--------------------------------------------------------------
需要遵守下面的规则:
1.去除重复的信息。
2.去除对回答问题没有帮助的信息。
3.去除错误的信息。
4.简要回答问题,重点突出,不过多花哨词藻。
5.不在多处讲到同一个细节点,一个点只出现一次。
6.尽量多的使用数值类信息。
7.需要高度注意信息的时效性
8.不可以出现XXX、ABC等不明确的词语。

之前的对话:
{chat_history}

背景信息是:
{background}

今天的日期是: {date}

开始!
我的问题是: {input}

--------------------------------------------------------------
必须使用中文进行详细的回答。你需要聚焦在我的问题上,不要延伸这个问题,让我们一步一步来。
metadata:
type: 'PROMPT'
version: 'demo_executing_agent.cn'

来源

记录

融资事件库

36 氪创投平台

  • 2021 年14390
  • 2022 年11039
  • 2023 年5354
  • 2024 年1187

可以对比往年融资事件,较往年,断崖式下降,说明今年的经济是真的很差。

Img

推荐文章

  1. 王慧文清华产品课
  2. LLM x 书签收藏:摘要 & 全文索引
  3. 程序员应该访问的最佳网站中文版原版
  4. Agent 实践

开发相关项目

47ng/nuqs

适用于 React 框架的类型安全搜索参数状态管理器,可以方便管理 URL 参数的管理。

https://github.com/47ng/nuqs

1
2
3
4
5
6
7
8
9
10
11
12
13
import { useQueryState } from 'nuqs'

export default () => {
const [name, setName] = useQueryState('name')
return (
<>
<h1>Hello, {name || 'anonymous visitor'}!</h1>
<input value={name || ''} onChange={e => setName(e.target.value)} />
<button onClick={() => setName(null)}>Clear</button>
</>
)
}

代码可以实现获取 url 中 name 参数,如果有项目需要在 URL 中设置复杂参数,可以考虑使用该库。

URL name value Notes
/ null No name key in URL
/?name= ‘’ Empty string
/?name=foo ‘foo’
/?name=2 ‘2’ Always returns a string by default, see Parsing below

markdown-to-image

https://github.com/gcui-art/markdown-to-image

markdown-to-image 是一个 react 库,能够实现使用 markdown 制作分享海报。

IMG

nut.js

https://github.com/nut-tree/nut.js

使用 Node 进行原生 UI 测试 / 控制,结合 LLM 可以用来开发 Computer use 功能。

桌面自动化 demo

1
2
3
4
5
6
7
8
9
10
11
12
await mouse.move(
straightTo(
centerOf(
screen.find(
imageResource('button.png')
)
)
)
);
await mouse.click(Button.LEFT);
await keyboard.type('Hello World!');
}

screenshots

https://github.com/nashaofu/screenshots

screenshots 是一个基于 electron 和 react 的截图插件,可以快速地实现截图功能,并支持多种截图操作,例如马赛克、文本、画笔、箭头、椭圆和矩形。

Img

Addax

https://github.com/wgzhao/Addax

Addax 是一个多功能的开源 ETL 工具,可以在各种关系型数据库管理系统(RDBMS)和非关系型数据库(NoSQL)之间无缝传输数据,使其成为数据迁移的理想解决方案。

valibot

https://github.com/fabian-hiller/valibot

这是一个用于验证结构化数据的模块化且类型安全的模式库的描述。它强调了该库具有模块化的特点,同时在验证数据时能够保证类型安全,适用于各种结构化数据的验证场景。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import * as v from 'valibot'; // 1.24 kB

// Create login schema with email and password
const LoginSchema = v.object({
email: v.pipe(v.string(), v.email()),
password: v.pipe(v.string(), v.minLength(8)),
});

// Infer output TypeScript type of login schema
type LoginData = v.InferOutput<typeof LoginSchema>; // { email: string; password: string }

// Throws error for `email` and `password`
v.parse(LoginSchema, { email: '', password: '' });

// Returns data as { email: string; password: string }
v.parse(LoginSchema, { email: 'jane@example.com', password: '12345678' });

runlike

https://github.com/lavie/runlike

给定一个现有的 Docker 容器,打印运行它的副本所需的命令行。

1
2
3
4
5
6
7
8
9
10
11
12
$ runlike -p redis

docker run \
--name=redis \
-e "PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin" \
-e "REDIS_VERSION=2.8.9" \
-e "REDIS_DOWNLOAD_URL=http://download.redis.io/releases/redis-2.8.9.tar.gz" \
-e "REDIS_DOWNLOAD_SHA1=003ccdc175816e0a751919cf508f1318e54aac1e" \
-p 0.0.0.0:6379:6379/tcp \
--detach=true \
myrepo/redis:7860c450dbee9878d5215595b390b9be8fa94c89 \
redis-server --slaveof 172.31.17.84 6379

anchor

https://github.com/anchordotdev/cli

anchor 提供本地开发环境 https

有用又好玩的软件

HuggingChat

https://huggingface.co/chat/ huggingface 开源的大模型不需要自己搭建了,直接在线使用,良心产品。

Img

GitHub Socialify

https://socialify.git.ci/trumandu/toolkit?name=1&owner=1&pattern=Charlie%20Brown&stargazers=1&theme=Light

GitHub Socialify 可以用来社交化分享自己的项目,制作精美项目卡片。

Img

Cap

https://github.com/CapSoftware/Cap

mac 端录屏开源软件

Cap

warp

https://www.warp.dev/

warp 是一个支持 AI 功能的 mac 命令终端工具,它将命令按 block 区分,免费版足够使用。

Img

快图设计

https://github.com/ikuaitu/vue-fabric-editor

快图设计-基于 fabric.js 和 Vue 的开源图片编辑器,可自定义字体、素材、设计模板。

Img

cobalt.tools

https://cobalt.tools/

可以根据地址在线下载视频

Img

QD

https://github.com/qd-today/qd

QD —— HTTP 请求定时任务自动执行框架 base on HAR Editor and Tornado Server。HAR 为 chrome 抓取的网络请求 log。

Img

XDOllama

https://github.com/dunbin/XDOllama

适用于 MacOS 上快速调用 Ollama\Dify\Xinference 的 AI 模型界面。

Img

wcf.js 微信机器人框架

https://github.com/wechatferry/wechatferry

基于 WechatFerry 的微信机器人底层框架

Img

Windows Update Disabler

https://github.com/tsgrgo/windows-update-disabler

使用轻量级批处理工具禁用 / 启用 Windows 更新。

Skyvern

https://github.com/Skyvern-AI/skyvern

Skyvern 使用大语言模型和计算机视觉自动化基于浏览器的工作流。

Img

Windows Agent Arena

https://microsoft.github.io/WindowsAgentArena/

Img

photoview

https://github.com/photoview/photoview

自托管相册

Img

tvbox

https://github.com/qist/tvbox

tvbox 源

说明

杜架的记录与分享相关信息:

🙌 如果你阅读到这里,相信我们一定是同道中人,有任何想法,欢迎私聊我,微信号:trumandu007
⚡️ 如果你也是在西安地区从事 IT 相关工作,欢迎私信加入我建的 『西安 IT 技术圈』微信群,我们是一个什么样的群体? 为什么要做『西安 IT 技术圈』
👬🏻 朋友,都看到这了,确定不关注一下么 👇

trumandu_wechat_2022.png

参考资料