TreeBlog
http://bk.treeblog.top/
Your description here.
-
【折腾分享】电脑平铺桌面
http://bk.treeblog.top/index.php/archives/176/
2025-10-11T21:00:17+08:00
什么是平铺就是桌面上应用软件会自动给你排好,排整齐无堆叠,现在 arch 下面的 niri 还是好用. 主要是处理多任务的时候直观方便。下面是 windows 桌面的截图折腾经历这两天又折腾了下 windows 下的平铺软件【安装了komorebi和yasb】,之前就弄过 FancyWM, 比较方便简单,开箱即用,但是有时候感觉暂时有点卡卡的。主流的好像也就是三个。FancyWMkomorebi (现在用的,搭配的【 yasb 一个状态栏 】)glazewm (没用过,听说配置文件配置的简单点)komorebi 怎么说了,最开始也不会用,🤣可能这才是常态。去 github 上下载了最新的程序,结果安装桌面连个快捷方式也没有,还好会用 everything 搜索,里面一堆程序最开始点了那个 1 的 exe,弹一个黑框框,就让他一直显示也能用,就是有点丑还不是后台的运行,后来看了使用介绍才知道,可以用那个 2,在 cmd 里面运行 komorebic.exe start 就静默运行了,然后 komorebic.exe -h 里面实际上是有很多介绍,一些命令快捷操作,弄了还是很方便2 个经验:要知道自己的目标是什么,根据目标慢慢找,耐心看一下看到英文的不要慌,开个网页翻译耐心看一点其实 yasb 和 komorebi 安装还是简单,主要是使用yasb 那个配置还是有点麻烦,也要看他的文档,还是下载别人的主题最方便,右键图标点那个 get themes,需要正确上网配合 autohotkey 来使用的快捷键,主要用它那个【toggle-monocle】实现全屏FancyWM 安装步骤去 github 上下载了(cer 和 msixbundle 文件),用 PowerShell (as Administrator) 就可以安装certutil.exe -addstore TrustedPeople .\FancyWM.Package_1.0.0.0.x64.cer
Add-AppxPackage -Path .\FancyWM.Package_1.0.0.0.x64.msixbundle相关软件下载链接
-
凡人寿
http://bk.treeblog.top/index.php/archives/175/
2025-10-10T15:00:26+08:00
之前在很多地方看到关于【人类寿命的极限探讨】在网上搜了搜人类寿命的极限探讨人类寿命的上限是一个长期存在的研究课题。现代科学研究与古代文献记载在这一问题上呈现出某种一致性。科学研究的观点目前存在两个主要的科学理论。海夫利克极限理论(Hayflick Limit)指出,由美国生物学家 伦纳德・海夫利克(Leonard Hayflick 于 1961 年提出,人体细胞的分裂次数有限,约为 40-60次。每次分裂时,染色体末端的端粒会缩短。当端粒缩短至临界值时,细胞停止分裂,机体进入衰老状态。根据此理论计算,人类寿命上限约为120岁。海夫利克极限是细胞生物学领域的核心理论1生理韧性理论是近年来提出的新观点。发表在《自然通讯》上的研究表明,人体的自我修复能力随年龄增长而下降。研究模型显示,在120至150岁之间,人体的修复能力将降至临界点,此时即使无重大疾病,生命也难以维持。这两个理论从不同角度将人类寿命极限定位在120-150岁区间。古代文献的记载中国古代典籍中也有相关论述。《黄帝内经》记载,遵循养生之道者能达到"天年",即"度百岁乃去"。后世注解将"度百岁"解释为120岁。《尚书》明确记载"上寿"为120岁。古代文献的记载与现代科学研究结论存在相似性。这些记载基于长期的生活观察和经验总结。小结从现有证据来看,人类寿命存在一定的生物学上限。科学研究与历史文献都指向相似的数值范围。对个体而言,在既定的生命长度内如何维持健康状态,可能比追求极限寿命更具现实意义。参考资料:Pyrkov, T.V., Avchaciov, K., Tarkhov, A.E. et al. Longitudinal analysis of blood markers reveals progressive loss of resilience and predicts human lifespan limit. Nat Commun 12, 2765 (2021).《黄帝内经·素问·上古天真论》《尚书·洪范》 [4] Hayflick L .THE LIMITED IN VITRO LIFETIME OF HUMAN DIPLOID CELL STRAINS.[J]. Experimental Cell Research, 1965, 37 (3): 614-636. DOI: 10.1016/0014-4827 (65) 90211-9. ↩
-
2025-08-30流水记
http://bk.treeblog.top/index.php/archives/174/
2025-08-30T20:52:59+08:00
回顾下去 6 月-8月去哪转了转第一组照片六月【6-27】的时候去一个【卷桥河公园】非常大,就是天气太热了,还租了个车没跑一会然后就没起了,最后还是走回来的,下面是照片太阳很好,颜色很正。这张忘记在哪拍的了【7 月 2 日拍的】第三组照片去了一个动物园,野生动物园,还看见了大棕熊和老虎第四组【去江边公园拍到的】最后一组今天拍的小猫
-
【雷达学习】双基地MIMO-ESPRIT方法解互耦回忆
http://bk.treeblog.top/index.php/archives/173/
2025-06-20T23:09:44+08:00
主要学习来源于这篇文章:《Joint DOD and DOA estimation of bistatic MIMO radar in the presence of unknown mutual coupling》大致思路是:先回忆了下 ULA 的 ESPRIT 方法;然后是 MIMO 下的 ESPRIT 方法然后是看文章看不懂,然后 AI 帮我解析,先读出大致的框架,然后丰富细节,最后对自己的理解进行确认,然后画出代码仿真的关键点下面在这个网盘下面提供 2 个 PDF 和一个代码方便之后回顾学习https://a.siyouyun.ren:30597/OutSaveFile2/RadarXG/ESPRIT_Double_mimomatlab 代码预览clc,clear all,close all;
%% Parameters of the radar system
M = 7; % number of Tx
N = 7; % number of Rx
d = 0.5; % inter-element space
% theta = [15 -10 5]; % DOA
% phi = [20 35 60];
theta = [-50 20 60]; % DOD % DOA
phi = [20 40 60];
K = length(theta); % number of target % dopplor frequency shift
L = 100; % number of sanpshot
SNR = 30; % signal-to-noise ratio before matched filtering
Geo_Rx = [0:N-1]; % geometry of Rx
Geo_Tx = [0:M-1]; % geometry of Tx
At = exp(-j*2*pi*d*Geo_Tx.'*sind(phi)); % transmitting direction matrix
Ar = exp(-j*2*pi*d*Geo_Rx.'*sind(theta)); % receiving direction matrix
item = 10;
%% 设置互耦系数;
mc_K = 2;
mc_nb = mc_K+1;
C_t = generateMCMmat(M,mc_nb);
C_r = generateMCMmat(N,mc_nb);
C = kron(C_t,C_r);
%% 设置选择Pt和Pt矩阵
Pt = [zeros(M-2*mc_K,mc_K),eye(M-2*mc_K),zeros(M-2*mc_K,mc_K)];
Pr = [zeros(N-2*mc_K,mc_K),eye(N-2*mc_K),zeros(N-2*mc_K,mc_K)];
M1 = M-2*mc_K;
N1 = N-2*mc_K;
P = kron(Pr,Pt);
% number of trials
%% Selective matrices
JM1 = [eye(M1-1),zeros(M1-1,1)];
JM2 = [zeros(M1-1,1),eye(M1-1)];
JN1 = [eye(N1-1),zeros(N1-1,1)];
JN2 = [zeros(N1-1,1),eye(N1-1)];
Jt1 = kron(JM1,eye(N1));
Jt2 = kron(JM2,eye(N1));
Jr1 = kron(eye(M1),JN1);
Jr2 = kron(eye(M1),JN2);
a_kronrao = zeros(M*N,K);
for i=1:K
a_kronrao(:,i) = kron(At(:,i),Ar(:,i));
end
for item_num = 1:item
disp(['SNR = ',num2str(SNR),' dB, ',num2str(item_num), ' # try : ']);
%% Matched Filtering
S = randn(K,L)+1i*randn(K,L);
X_0 = C*a_kronrao * S;
X = awgn(X_0,SNR,"measured","dB");
Y = P * X;
%% Eigen decomposition
%Rx = (X*X')/L; % Estimated covariance matrix
Rx = (Y*Y')/L;
[Es,D] = eigs(Rx,K,'LM'); % Signal subspace
%% Rotational invariant property
Vt = pinv(Jt2*Es)*Jt1*Es;
%Vt = pinv(Jt1*Es)*Jt2*Es;
[T,Phit] = eig(Vt);
Phir = inv(T)*pinv(Jr2*Es)*Jr1*Es*T;
%Phir = inv(T)*pinv(Jr1*Es)*Jr2*Es*T;
E_theta = asind(angle(diag(Phir))/pi).';
E_phi = asind(angle(diag(Phit))/pi).';
plot(E_theta,E_phi,'k*');hold on;
end
H(1)=plot(E_theta,E_phi,'k*');hold on;
H(2)=plot(theta,phi,'rx','markersize',28);grid on;
xlabel('DOA'),ylabel('DOD');
legend([H(1),H(2)],'Esimated','Ture')闲聊没想到 matlab 还可以画出这样的图片,“赛博生命”,hhhhttps://mp.weixin.qq.com/s/GS-jSHnasVxrrIn5C2E3WQfigure('Position',[300,50,900,900], 'Color','k');
axes(gcf, 'NextPlot','add', 'Position',[0,0,1,1], 'Color','k');
axis([0, 400, 0, 400])
SHdl = scatter([], [], 2, 'filled','o','w', 'MarkerEdgeColor','none', 'MarkerFaceAlpha',.4);
t = 0;
i = 0:2e4;
x = mod(i, 100);
y = floor(i./100);
k = x./4 - 12.5;
e = y./9 + 5;
o = vecnorm([k; e])./9;
while true
t = t + pi/90;
q = x + 99 + tan(1./k) + o.*k.*(cos(e.*9)./4 + cos(y./2)).*sin(o.*4 - t);
c = o.*e./30 - t./8;
SHdl.XData = (q.*0.7.*sin(c)) + 9.*cos(y./19 + t) + 200;
SHdl.YData = 200 + (q./2.*cos(c));
drawnow
end
-
远程控制大战
http://bk.treeblog.top/index.php/archives/172/
2025-05-22T18:12:02+08:00
这两天突发奇想再次捣鼓远程桌面,也是因为之前一直用 mstsc 微软的 RDP 远程桌面,感觉还是稍微有点卡, 之前也弄过解锁 60 FPS 什么的,但是还是感觉不明显,今天记录下各个远程软件和推荐;各个软件微软 RDP,网易 UU 远程,RustDesk(知名开源),向日葵,ToDesk,连连控,云玩加(个人开发者)前提要节对于一些国内厂商的远程,一般都提供他们自己的服务器进行进行搭桥或者连接,网易 UU 好像在网络好的时候可以 p2p 。例如向日葵,ToDesk 两个比较知名了,平时办公用用也还是可以的,但是也还是有些小问题,例如跨境连接等。所以,基于以上原因,对于我来说,先把两个外网的设备内网穿透桥接起来。用 皎月连 (需要打卡)或者 openp2p 这两个都可以;至于 zerotier 和 tailscale,前一个没弄好,后一个没用过;微软 RDP基于 皎月连 或者 openp2p 就可以通过 windows 的 mstsc 访问了,但好像貌似专业版系统,还要简单设置下一个知乎设置教程一个免密码登陆教程然后还有两个解锁 60 FPS 的教程,解锁60fps-1, 解锁2 怎么说了?之前平时一直是这么用的,感觉也还好,但是就是感觉(外网-手机热点)60 fps 还是没有这两天看了检查方法检测 60 fps 是否达到肉眼检测,😂,这个网站: https://frameratetest.org/zh/fps-test ,看看那两个竖着的黑杠杠动的是否流畅,还是可以看出分别,可以本机电脑开一个,远控电脑开一个,放在屏幕上对比了看,还是比较明显的,🤣推荐 RustDeskRustDesk 也是看的别人的教程,内网穿透后使用的,有两个软件要安装;被控端(服务端+客户端)安装;本机电脑(客户端安装),客户端下载链接, 服务端下载链接,这是两个 github 的链接,这是 github加速网站;看的这个教程:教程,主要就是下载好这几个软件,设置下 ip 和 key有几个小细节就是;可以吧下图的那个取消掉,网络好的话就是 p 2 p 直接连接,判断通过为全屏时左上角是✔就是 p 2 p,是刷新符号就是中继如果声音没有,可以看看 github 的 issue,我是把下图的禁用勾选了,就有声音了总体来说体验还是很不错的,速度上好像还比较快其他软件uu 远程有时候还可以,有时候可以 60 FPS然后是,连连控,还可以,可以稳定 60 FPS,稳定!!我都用的手机热点,还是可以,但是有些要开 vip云玩加,b 站上一个 up 开发的,还可以适配了手柄,还是开源免费的,fps 没确定,但是好像是自己弄了服务器,帮助记录下账号和两个机器握手,大概是这样小结就这些,推荐 RustDesk。但其实还有 Parsec(steamcommunity_302. exe 用的这个软件提供网络访问协助,Parsec 国内有些不好访问),但是我屋里电脑没弄那个显示器,Parsec 这个速度倒是可以,但是居然没自带虚拟显示器,ParsecVDisplay 这个 github 项目可以添加,但是今天还是下单了个 HDMI 欺骗器 5¥就这些了,RustDesk 还是可以的!
-
PDF翻译-ai加持下的梅开二度
http://bk.treeblog.top/index.php/archives/170/
2025-04-21T10:50:28+08:00
之前 pdf 翻译,看了别人的开源项目,一般是先解析为 md 文件,再翻译,现在借助多模态 ai 强大的图片ocr 可以直接翻译主要思路,把 PDF 转为一张张图片,然后给 ai ,让其输出翻译好的 md 文本,工具如下:我用的豆包 1.5 的 vision 版本-大模型 api,提示词也可以自定义效果大概如下图:推荐火山引擎 api: https://console.volcengine.com/auth/login还有一个硅基流动的: https://siliconflow.cn/zh-cn/openrouter 好像也有些免费的蓝奏云工具下载链接,api 在 config.json 里面要自己填下:https://wwzw.lanzoup.com/i70mH2u34nve这是源代码: https://wwzw.lanzoup.com/i60jm2u34ydc
-
备案了!记录下
http://bk.treeblog.top/index.php/archives/159/
2025-04-08T12:14:48+08:00
终于备案了!没想到,通过阿里云备案还挺方便的
-
AI的使用第二期
http://bk.treeblog.top/index.php/archives/158/
2025-03-21T21:55:00+08:00
前言:前段时间写了个关于 ai 使用小结分享下, 创建时间 2025-03-21 22:00目录一、大模型的背景与来历:从神经网络到现代大语言模型二、基础平台三、对话:提问与提示词技巧四、信息搜集五、AI 编程六、使用技巧七、API 调用与知识库八、本地大模型部署九、多模态生成十、资源与社区十一、硬件性能与优化连接主义的萌芽(1940 s-1980 s) 神经网络的概念源于 1943 年神经生理学家 Warren McCulloch 和数学家 Walter Pitts 提出了第一个数学神经网络模型提出的“M-P 神经元模型”,但受限于算力和数据,长期停留在理论层面。1986 年,反向传播算法(Backpropagation:BP)的提出,使其利用数学中的链式法则计算梯度,使多层感知机(MLP)实现有效训练,奠定了现代深度神经网络的基础,但是由于受限于硬件和算法,早期模型难以解决复杂任务,90 年代后神经网络研究陷入低谷。第二次爆发:gpt 自然语言大模型2015 年,由 Sam Altman 等人创立的 OpenAI 以非营利组织的形式成立,初衷是确保通用人工智能 (AGI) 的发展安全且对全人类有益。在语言模型方面,OpenAI 采用了 google 在 17 年提出的 Transformer 创新架构。Transformer 利用自注意力机制,能够并行处理输入序列中的所有词,大大提高了训练效率和模型性能。GPT 系列(2018-2024):GPT-1(2018):基于 Transformer 解码器,首次采用无监督预训练+有监督微调策略,参数 1.17 亿。GPT-2(2019):参数增至 15 亿,提出“零样本学习”(Zero-Shot),验证模型规模与泛化能力的正相关。GPT-3(2020):参数达 1750 亿,引入“上下文学习”(In-Context Learning),通过 Few-Shot 提示解决多样化任务,标志大模型通用化。GPT-4/4 o(2023-2024):多模态支持(文本+图像+音频),引入强化学习与人类偏好对齐(RLHF),推理能力接近人类。这种"规模化"策略证明了大型语言模型能够表现出令人惊讶的能力,包括上下文学习、任务泛化和涌现能力。故事插曲:GPU 的关键作用与 NVIDIA 的崛起大模型训练依赖海量计算力,传统 CPU 无法满足需求。GPU (图形处理单元) 凭借其并行计算能力,成为深度学习的理想硬件。单个现代 GPU 可以同时处理数千个线程,比 CPU 快数十到数百倍。NVIDIA 公司的创始人黄仁勋有着传奇色彩的故事。他 1963 年生于台湾,后移民美国。NVIDIA 最初专注于为电脑游戏提供高质量的图形处理解决方案。有趣的是,NVIDIA 的 GPU 最初完全是为游戏和图形渲染设计的。2006-2007 年,研究人员发现 GPU 强大的并行计算能力可用于加速神经网络训练,NVIDIA 敏锐地捕捉到这一机会,开发了CUDA 编程平台,使开发者能更容易地利用 GPU 进行通用计算。随着深度学习的兴起,NVIDIA 从一家游戏图形公司转型为 AI 计算的基础设施提供商,成为全球最有价值的公司之一。二、大模型基础知识(直接对话类)去哪里使用大模型?引子:推荐优先选择 GPT-4、Claude、DeepSeek 等头部模型,根据需求与场景选择国内外平台。大模型大致可以分为国内国外两类:一、国外平台主流模型:ChatGPT(OpenAI):通用性强、响应速度快,适合全能型任务(如报告撰写、数据分析)。Claude(Anthropic):擅长进行文学创作,与代码编程。这是它的优势特点,很多编程插件首先选用 claude 模型。访问方式:需代理:国内用户需通过海外网络环境访问,gpt 官方大约 20 美元/月,claude 也是。国内第三方代理,付费工具推荐Sider(浏览器插件):( https://sider.ai/zh-CN )支持多模型切换、文件解析、实时联网搜索,功能集成度高。【成本多少】IMYAI 智能助手:( https://super.imyai.top/c )多模型聚合(含 GPT-4 o、Claude 3),支持上传 PDF/Excel 提问,ai 绘图。银行录像局( https://nf.video/ ):稳定访问 GPT/Claude,支持长对话与文件处理。closeAI( https://www.closeai-asia.com/ ):一家专门提供 api 访问的公司,很稳定,按量付费二、国内平台(1)自研特色模型豆包(字节跳动):通用性好,做了很多关于 ai 赋能基础建设,例如 ai 代码开发(后面会讲),app 上支持 AI 电话(语气逼真),ai 耳机实时沟通等(硬件联动)( https://www.doubao.com/chat/ )。通义千问(阿里巴巴):开源生态完善(Qwen 系列)、本地部署友好(Ollama 平台长期霸榜),支持法律 AI 顾问( https://tongyi.aliyun.com/ ),通义万象 2.1 视频模型。Kimi(月之暗面):【国产大模型最早出来的一批,ai 独角兽公司】200 万字长文本解析(如合同审查、论文总结),AI+PPT 自动生成(输入大纲即可输出完整幻灯片)( https://kimi.moonshot.cn/ )。DeepSeek(深度求索):低成本高智商模型(R 1 开源版性能比肩 GPT-4),官网访问易拥堵,推荐通过第三方平台调用( https://www.deepseek.com/ )。阶跃 AI:多模态很不错,视频生成一致性好( https://yuewen.cn/chats/new )。(2)综合集成平台问小白( https://www.wenxiaobai.com/chat/200006 ):实时调用满血版 DeepSeek,响应速度很快。纳米搜索(360 出品, https://bot.n.cn/ ):支持多种国产模型切换(包含 DeepSeek)。腾讯元宝:集成了 DeepSeek 模型( https://yuanbao.tencent.com/chat/ )。示例应用(以"区块链"为例):直白释义:区块链是一种通过链式数据结构存储信息的分布式账本技术,核心特征是去中心化和不可篡改。使用场景:①加密货币交易 ②供应链溯源 ③电子合同存证举例说明:• 例 1:比特币系统中,每笔交易通过哈希函数生成唯一标识(如 SHA-256 算法:H = Hash (Tx_Data)),多个交易按时间顺序连接成区块• 例 2:类似全班同学共同记录收支的公共笔记本,任何人修改记录需获得半数以上同学同意,且修改痕迹会被永久保留直观类比:"区块链就像乐高积木,每个新积木块(区块)必须严丝合缝扣在前一块上,想偷偷拆掉中间某块?除非你拆掉整个后半段并让所有玩家都同意"5.由来:xxxx
【演示例子:什么是量子力学】
【什么是信号处理中的谐波】
【什么是热力学第二定律】
提升类提示词在网络上有很多网友分享了自己的提示词,里面有他们自己的经验和思考,又很多通用的地方。总结出了“一步步思考”这个方法,例如在自己的问题最下面加一个“step by step think”或者“一步步思考”给出答案,那么比直接提问的效果就稍微好一些。例如:Take me deep breath and work on this problem step-by-step.
Write your answer and give me a confidence score between 0-1 for your answer. Are you sure?
This is very important to my career.
You'd better be sure.
用中文回答还有,可以对问题本身进行提问,例如"对于这个问题 xxx,你怎么看?"让大模型帮你分析问题的解决方法。例如写文章的时候,先让大模型写大纲这些。https://www.aishort.top/ ,这是一个专门写提示词的网站。记得之前 think 版本的模型还没出来的时候,有一个厉害的高中生(涂津豪)写了让 claude 仿人类的思考的提示词,直接把 claude 的水平提高了一大截。https://github.com/richards199999/Thinking-Claude 这是那个提示词的 github,还有一个关于 claude 提示词的 github( https://github.com/langgptai/awesome-claude-prompts )与大模型的聊天确实一定程度上训练了人精准提问的能力。TopBook 的 b 站视频,也讲了写关于提问与使用上的方式【突破个人能力天花板,和 AI 协作的 12 个范式。】 https://www.bilibili.com/video/BV1pgmbY1EXX/?share_source=copy_web&vd_source=84d1208a0ce8dac7e5646fcc327301a5上面的思考方法也叫思维链方法 COT,模仿人的思考是有一个一个步骤的(Chain-of-Thought, CoT)自我验证(如“请检查上述答案是否有逻辑错误”)四、大模型信息收集:联网模型的应用价值在数字化工作环境中,高效获取和处理信息已成为核心竞争力。具备联网能力的大模型彻底改变了传统信息搜集方式,将"搜索"与"理解+整合"结合,大幅提升信息获取效率。优势:实时信息获取,信息整合能力工具推荐Kimi、豆包、元宝、问小白、纳米搜索1. Kimi Chat(最推荐)实时性极佳,搜索结果全面,搜索的网页多【测试搜索今日新闻】2.豆包除了文字类信息搜索,有独家抖音生态接入,可以搜索到抖音视频3.元宝/问小白/纳米搜索这几个采用 deepseek+联网的模式,联网搜索效果也不错使用场景1.市场动态实时追踪(Kimi):快速获取行业报告、政策更新、突发事件等时效性敏感信息2.学术研究与文献综述引文查找(纳米搜索+Kimi)这个月政府采购网发布了哪些采购的内容?给我找出10片关于地波雷达的论文,帮我列出名字来,方便我引用。五、大模型编程开发工具AI 的快速发展,也给开发者带来了便利。基础的使用,就是让在对话式 ai 里,描述需求,帮我们写小的功能模块,或者查询资料。【字符串正则匹配是一个很好用的例子】gadfgadfgaadf 发生的发 fsdf进一步的推荐两个工具:Trae,字节跳动对标国外 Cursor,实现自然语言对话一键生成代码,现阶段 gpt 和 claude 可免费调用Vscode,微软开源的轻量 IDE,支持很多 AI 插件(提供了代码补全,优化,重构等),推荐 MarsCode 插件与 Cline 插件(cline 需要 api 但是可以实现与 Trae 一样的功能)【帮我写一个 html 的登录界面,用 css 和 js 美化】【一个 Trae 写的工具的例子:PDF 转图片】【一些 Vscode 截图】【阅读他人的项目代码,或者过去的代码,达到快速理解的目的,或者优化代码】【代码提示,代码补全,代码注释】六、大模型使用技巧具体的使用案例6.1 Mermaid 流程图https://www.mermaidchart.com/6.2 PlantUML 图( https://plantuml.com/zh/ )6.3 图片转文字描述可以直接把图片转为对应的图片描述提示词:帮我用结构化的语句把图片内容描述出来,要专业,即使看不见的图片的人听了,也知道这个图的详细内容6.4文档类处理1. 公式转换【图片转公式,公式复制到 word】:https://www.latexlive.com/2. 全文翻译演示 2 种:阿里的通义千问可以直接对整个 pdf 翻译PDF 转图片,然后直接丢给大模型翻译3. markdown 输出 word 文档markdown,一级标题二级标题演示4.文档检视:错别字检查、术语校对、格式标准化帮我检查下面文字中的错别字:
“今天天七真不错, 是个大晴天,适合出去删不!”5. 大模型+Kimi:自动生成 PPT 大纲与内容通义千问也有https://tongyi.aliyun.com/aippt6. 技术文档生成(从代码/描述生成完整文档)文本润色(语法、术语、风格优化)6.5 法律援助(通义千问)网站链接: https://tongyi.aliyun.com/qianwen/agent/home?type=FindAgent

## **七、大模型 API 调用与 RAG 知识库**
通过电脑上的客户端软件对大模型 api 调用,api 调用更加自由,可以自己开发自定义的程序。聊天更加流畅。推荐一个软件 CherryStudio。
https://cherry-ai.com/的官网 ,找到下载链接安装即可
下面为软件图片

重点在于其可以调用本地知识库进行知识库问答,非常方便。
1. 获取 api,火山引擎或者硅基流动的 API,deepseek 的 api 也可以使用
2. 在软件中填写 api 密钥
3. 设置知识库,进行对话
## **八、隐私、安全与本地部署**
1. **隐私风险与应对**
- 数据脱敏、企业合规要求
2. **本地大模型部署**
- 
- **Ollama 教程**:模型下载、运行、微调(如 LLaMA 3 本地化)( https://ollama.com/ )
- 硬件要求:CPU/GPU/NPU 性能优化
## **九、多模态生成**
1. **图片生成**
- 豆包, https://www.doubao.com/chat/create-image
- Midjourney/DALL·E 提示词设计
- comfyui,真正要升入了解绘画,视频,就要了解这个工具
- >ComfyUI 是一个开源的图形化界面工具,主要用于 Stable Diffusion 模型的图像生成工作流设计,其节点式可视化操作是最大特色,用户可以通过拖拽节点来精确控制图像生成的每个环节
2. **视频生成**
- 短视频生成,(腾讯、阿里、跃问)
- https://tongyi.aliyun.com/wanxiang/videoCreation , 通义万象 2.1
- https://yuewen.cn/videos?utm_source=yuewen_nav&utm_medium=nav_link ,跃迁
3. **声音合成**
- 语音克隆(工具:ElevenLabs、Azure TTS,ChatTTS)
- https://www.chattts.co/zh#free
## **十、资源与社区**
1. **外部资料整合**
- 李燕姐提供的 PDF 文档
- 
- [金子的AI知识库](https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFf)(工具与案例库)
- [七小姐的提示词博物馆](https://vxc3hj17dym.feishu.cn/wiki/VDb1wMKDNiNj0mkJn6VcFgRenVc)(模板库)(可以吹一波飞书文档)
- 豆包: https://www.doubao.com/chat/
kimi: https://kimi.moonshot.cn/chat/
问小白: https://www.wenxiaobai.com/
纳米 AI: https://bot.n.cn/
closeAI(api 类): https://www.closeai-asia.com/
火山引擎(api 类): https://www.volcengine.com/
硅基流动(api 类): https://cloud.siliconflow.cn/
IMYAI-GPT: https://new.imyai.top/ ; https://super.imyai.top/chat
cherryStudio(客户端): https://cherry-ai.com/
chatBox(客户端): https://chatboxai.app/zh
trae(编程 IDE): https://traeide.com/或https://www.trae.ai/home
- 
2. **提示词社区构建**
- 提示词版本管理(GitHub 仓库或飞书多维表格)
- 开源社区平台
- Hugging Face、ModelScope( https://www.modelscope.cn/my/overview ),GitHub 等,ollama(国外)
#### **十一、硬件性能与优化**
在大模型推动各行业变革的当下,2025 年随着技术趋势演进与行业实践深入,下面简单了解其算力部署指南,包括硬件角色、选择策略、模型硬件匹配及微调技术等。
#### 一、CPU/GPU/NPU 在大模型中的角色对比
1. **训练场景:GPU 主导,NPU 局部突破**
- **GPU**(如 NVIDIA H 100/A 100)
- **核心优势**:并行计算能力极强,支持大规模矩阵运算,适配 Transformer 架构的密集计算需求。
- **典型应用**:千亿参数模型训练(如 GPT - 5、DeepSeek 671 B),需多卡并行(如 8 卡 H 100 集群)。
- **NPU**(如华为昇腾 910 B、寒武纪 MLU)
- **适用场景**:端侧/边缘设备轻量级训练(如 10 B 以下模型),能效比优于 GPU,适配智能驾驶、安防等低功耗场景。
2. **推理场景:GPU 主流,NPU 边缘端崛起**
- **GPU**
- **优势**:显存带宽高(如 H 100 的 3.35 TB/s),支持多任务并发推理(如同时处理文本生成+图像识别)。
- **主流配置**:单卡显存≥24 GB(如 A 100 80 GB),适配 70 B 参数模型 FP 16 推理。
- **NPU**
- **突破点**:专为 AI 优化,单卡算力达 128 TOPS(如酷芯 NPU),在智能摄像头、手机端大模型(如 3 B 参数)部署中成本优势显著。
3. **CPU 的补充角色**
- **功能**:数据预处理、任务调度、小模型推理(如 1.5 B 参数模型纯 CPU 运行)。
- **优化方向**:英特尔至强 Sapphire Rapids 内置 AMX 加速器,推理性能提升 10 倍,适配金融风控等低延迟场景。
#### 二、主流硬件选择:GPU+大内存/显存成标配
1. **GPU 仍是算力核心**
- **国际厂商**:NVIDIA H 100(FP 8 精度性能翻倍)、AMD MI 300 X(192 GB 显存支持超大规模推理)。
- **国产替代**:华为昇腾 910 B(适配 DeepSeek R 1)、寒武纪 MLU(互联网大厂测试性能比肩 A 100)。
2. **内存/显存规格要求**
- **训练端**:千亿级模型:显存≥640 GB(8 卡 H 100 集群) + DDR 5 内存≥2 TB。
- **推理端**:
- 7 B 参数模型:FP 16 需 16 - 20 GB 显存,INT 4 量化后仅需 8 GB(如 NVIDIA RTX 4090)。
- 70 B 参数模型:需多卡并行(如 2×A 100 80 GB)或单卡优化(MI 300 X)。
#### 三、典型推理场景的模型与硬件匹配
| 场景分级 | 模型参数量 | 硬件配置 | 典型案例 |
|
# Thank you Listening
所有资料放在了这个网盘,可以下载: https://a.siyouyun.ren:30597/AI_Share
-
我的AI大模型日常使用攻略
http://bk.treeblog.top/index.php/archives/157/
2025-03-02T22:52:27+08:00
2023 年是 AI 大模型的元年,GPT 为代表的模型掀起了浪潮。2024 年末,Deepseek 横空出世,带来了更具性价比的大模型!下面主要包括工具推荐和提示词两方面的介绍。AI 使用心得在国内,已有众多可直接使用的优质 AI 产品,比如豆包、kimi、跃问、360 纳米搜索、问小白、deepseek、通义千问等,这些都非常好用,无需任何额外设置。然后如果想使用国外大模型,有时需要借助第三方代理服务。我有时候用的一个网站是 https://super.imyai.top/chat —— 这是一个可以选择多个大模型进行对话的平台,虽然需要付费,但也提供一定的免费额度。关于提问大模型有时候需要稍微针对性的描述,可以给出更好的答案。最开始的时候,网友们总结出了“一步步思考”这个方法,例如在自己的问题最下面加一个“step by step think”或者“一步步思考”给出答案,那么比直接提问的效果就稍微好一些。例如:Take me deep breath and work on this problem step-by-step.
Write your answer and give me a confidence score between 0-1 for your answer.
Are you sure?
This is very important to my career.
You'd better be sure.
用中文回答还有,可以对问题本身进行提问,例如"对于这个问题 xxx,你怎么看?"让大模型帮你分析问题的解决方法。例如写文章的时候,先让大模型写大纲这些。https://www.aishort.top/ ,这是一个专门写提示词的网站。记得之前 think 版本的模型还没出来的时候,有一个厉害的高中生(涂津豪)写了让 claude 仿人类的思考的提示词,直接把 claude 的水平提高了一大截。https://github.com/richards199999/Thinking-Claude 这是那个提示词的 github,还有一个关于 claude 提示词的 github( https://github.com/langgptai/awesome-claude-prompts ) 与大模型的聊天确实一定程度上训练了人精准提问的能力。TopBook 的 b 站视频,也讲了写关于提问与使用上的方式【突破个人能力天花板,和 AI 协作的 12 个范式。】 https://www.bilibili.com/video/BV1pgmbY1EXX/?share_source=copy_web&vd_source=84d1208a0ce8dac7e5646fcc327301a5API 调用方式除了网页使用外,API 调用也是一种重要方式:可以在本地部署免费开源的 ollama 并下载模型,不过普通电脑一般只能运行 3 B、7 B 规模的模型,效果还有提升空间网上推荐的 API 服务包括:火山引擎 API:支持完整版的 deepseek 模型,速度还可以(与豆包、抖音同属一家公司)(贴一个自己的邀请链接:邀请好友注册和使用,两个都有代金券免费额度: https://www.volcengine.com/experience/ark?utm_term=202502dsinvite&ac=DSASUQY5&rc=3UAYPF74 邀请码:3 UAYPF 74)硅基流动:提供免费额度,还有免费的向量嵌入模型,便于构建本地知识库。closeAI:支持 GPT 系列模型,网上搜索即可找到。实用 AI 软件推荐调用 API 的软件很多,我主要推荐:CherryStudio:可与本地文件联动构建知识库。与直接上传文件不同,它会将文件向量化,每次对话都能查询调用,不会因聊天过长而"遗忘"知识库内容chatBox 也是一个选择,不过我还没使用过AI 编程辅助工具cursor:国外工具,国内使用可能不太方便vscode 插件:cline:配合 API 使用可媲美 cursor 效果,支持直接对话、代码编写与修改Marscode:豆包出品,提供代码补全、工作文件夹提问等功能trae:字节跳动(豆包所属公司)基于 vscode 二次开发的 IDE 工具,对标 cursor,效果不错,可以调用 claude 和 gpt 辅助(trae 截图)一些网站资源的链接豆包: https://www.doubao.com/chat/kimi: https://kimi.moonshot.cn/chat/问小白: https://www.wenxiaobai.com/纳米 AI: https://bot.n.cn/closeAI(api 类): https://www.closeai-asia.com/火山引擎(api 类): https://www.volcengine.com/硅基流动(api 类): https://cloud.siliconflow.cn/IMYAI-GPT: https://new.imyai.top/ ; https://super.imyai.top/chatcherryStudio(客户端): https://cherry-ai.com/chatBox(客户端): https://chatboxai.app/zhtrae(编程 IDE): https://traeide.com/
-
《沙漠中的失落城市》
http://bk.treeblog.top/index.php/archives/156/
2025-01-03T10:18:17+08:00
杰森·威廉姆斯,一个身材瘦削却充满力量的中年男人,他那被阳光晒成古铜色的脸庞上刻着岁月的痕迹,深邃的蓝眼睛中闪烁着永不熄灭的好奇光芒。作为一名经验丰富的地理学家,他有着近乎偏执的求知欲,总是随身携带着那本已经翻得破旧的笔记本,记录着每一个可能解开历史谜团的线索。在开罗大学的地下档案室里,昏黄的灯光下,杰森正专注地研究着一份泛黄的古老地图。地图上布满了神秘的符号和模糊的标记,空气中弥漫着羊皮纸特有的霉味。突然,他的手指停在了地图右下角一个几乎难以辨认的标记上——那是一个由三个同心圆组成的符号,周围环绕着奇特的几何图案。"这不可能..."杰森喃喃自语,声音中带着难以掩饰的兴奋。他迅速翻出随身携带的笔记本,对比着之前在其他遗址发现的符号。随着研究的深入,他的心跳越来越快——这个标记指向的,正是传说中一夜之间消失的沙漠之城。传说中,这座城市的居民掌握着某种超越时代的技术,他们能够操控沙漠中的能量,创造出令人惊叹的奇迹。然而,在某个满月之夜,整座城市连同它的居民一起,如同海市蜃楼般消失在茫茫沙海之中。有人说这是天谴,有人说是外星文明的杰作,但真相始终被掩埋在无尽的黄沙之下。杰森的手指轻轻抚过地图上的标记,他能感觉到自己的手心已经微微出汗。这个发现可能会改写整个考古界的历史,但更重要的是,它可能揭示出人类文明发展过程中一个被遗忘的重要篇章。然而,就在他准备进一步研究时,档案室的灯光突然闪烁了一下。杰森警觉地抬起头,他隐约听到走廊里传来急促的脚步声,还有金属碰撞的声响。他迅速将地图收进特制的防水袋中,塞进外套内侧的口袋。直觉告诉他,这个发现可能比他想象的更加危险...第一章:进入沙漠杰森站在开罗郊外的营地前,看着眼前这支由五人组成的探险队。除了他,还有:阿里,一位年过五十的贝都因向导,脸上布满风沙刻下的皱纹,却有着鹰一般锐利的眼神萨拉,年轻的考古学家,精通古代文字,总是戴着一副厚重的眼镜汤姆,前特种部队成员,负责队伍的安全,肌肉发达却沉默寡言艾哈迈德,机械工程师,负责维护所有设备,脸上总是挂着乐观的笑容清晨五点,当第一缕阳光刚刚染红天际,队伍就启程了。吉普车在无垠的沙海中颠簸前行,车窗外是连绵起伏的沙丘,在晨光中泛着金色的光芒。随着太阳升高,温度急剧上升,车内的温度计显示已经超过45度。"看那边!"阿里突然指着远处喊道。只见地平线上出现了一片奇特的沙丘群,它们的形状与周围完全不同,呈现出规则的几何图案。更令人惊讶的是,这些沙丘在阳光下竟然泛着微弱的金属光泽。杰森立即叫停了车队。他小心翼翼地取出那张从档案室带出的古老地图,手指轻轻抚过地图上那个由三个同心圆组成的标记。突然,他注意到地图上的符号在阳光下泛着微弱的荧光,就像档案室那晚闪烁的灯光一样。"就是这里,"他的声音因为激动而微微颤抖,"这些沙丘的排列方式...和地图上的标记完全吻合!而且..."他停顿了一下,指着地图上发光的符号,"这些符号在阳光下会发光,就像传说中城市居民使用的发光材料一样。"队员们迅速搭建起临时营地。汤姆和艾哈迈德开始组装勘探设备,萨拉则仔细记录着周围的环境特征。杰森站在最高的沙丘上,感受着热浪扑面而来。他注意到,这里的沙子似乎比别处更细,而且带着一种奇特的磁性——指南针在这里完全失灵了。"这让我想起了档案室那晚,"杰森对萨拉说道,"当时灯光闪烁时,我听到的金属碰撞声,和现在这些沙子的磁性特征似乎有某种联系。"他蹲下身,抓起一把沙子,让它们从指缝间缓缓流下。"传说中,这座城市能够操控沙漠的能量,也许这些特殊的沙子就是证据。"夜幕降临时,沙漠的温度骤降。队员们围坐在篝火旁,讨论着第二天的计划。突然,远处传来一阵低沉的轰鸣声,像是某种巨大的机械在运转。所有人都屏住了呼吸,但声音很快就消失了,仿佛从未出现过。"明天,"杰森望着星空说道,"我们就要揭开这个千年之谜的第一层面纱了。"第二章:迷雾重重经过三天的艰苦挖掘,杰森和他的团队终于在一块巨大的玄武岩下发现了一个隐蔽的入口。入口处矗立着一扇高达三米的石门,上面布满了复杂的浮雕和符号。萨拉立即拿出笔记本开始记录:"这些符号...它们看起来像是某种数学公式和天文学符号的结合体。"汤姆用探照灯照亮了石门,突然,石门上的一些符号开始发出微弱的蓝光,就像他们在营地外发现的发光沙子一样。"这些符号在吸收光线!"艾哈迈德惊呼道。杰森小心翼翼地触摸石门,发现它的表面异常光滑,就像是被某种高科技工艺处理过。当他们推开石门时,一股冷风扑面而来,带着一股奇特的金属味。通道两侧的墙壁上镶嵌着发光的晶体,为黑暗的通道提供了微弱的光源。阿里摸了摸墙壁,"这些晶体...它们似乎在吸收我们手电筒的光,然后以不同的频率释放出来。"随着深入,通道逐渐开阔,最终他们来到了一个巨大的地下空间。眼前的景象让所有人都屏住了呼吸——一座宏伟的地下城市静静地躺在他们面前。城市的建筑呈现出完美的几何形状,墙壁上布满了复杂的管道系统,就像是一座精密的机器。在城市中央,他们发现了一个巨大的石桌,上面铺着一张泛着银光的羊皮纸。杰森小心翼翼地展开羊皮纸,发现上面布满了三维立体的符号,当光线照射时,这些符号会在空中投射出全息影像。"这...这太不可思议了!"萨拉激动地说,"这些符号不仅包含了数学公式,还似乎描述了某种能量转换系统。"她指着其中一个符号,"看这里,这个符号和我们在营地外发现的发光沙子完全一致!"就在他们沉浸在发现中时,突然传来一声尖叫。是艾哈迈德!当其他人赶到时,只看到他空荡荡的背包掉在地上,手电筒还在滚动,而人却消失得无影无踪。更诡异的是,地面上没有任何脚印或挣扎的痕迹。杰森立即命令所有人集合,但空气中弥漫着一种令人不安的寂静。他们能听到彼此的呼吸声,却听不到任何来自城市的声音——没有风声,没有机械声,甚至连回声都没有,仿佛这座城市在刻意隐藏着什么。第三章:迷雾背后的真相杰森和萨拉花了整整两天时间研究那张神秘的羊皮纸。随着研究的深入,他们发现这不仅仅是一份能源系统的设计图,更是一个关于城市命运的警示录。"看这里,"萨拉指着羊皮纸上一个复杂的符号,"这个符号和我们在石门以及发光沙子上看到的完全一致。它代表的是能量转换的核心——将阳光转化为城市运转所需的能量。"杰森仔细观察着全息投影中的三维模型,"这个系统...它太先进了。整个城市就像一个巨大的太阳能电池,利用特殊的晶体材料吸收阳光,然后通过地下管道网络输送到城市的每个角落。"突然,投影中出现了一段动态影像:城市居民们正在庆祝能源系统的成功运行。街道上闪烁着柔和的光芒,建筑物表面流动着能量波纹,就像他们在地下通道看到的发光晶体一样。但画面突然变得混乱起来。萨拉倒吸一口冷气:"这里记载着系统失控的过程。看这些符号的变化,它们显示能量开始不受控制地波动。"杰森指着投影中的一处细节:"这就是问题所在。他们试图用这些特殊的沙子——我们在地表发现的那种——来稳定系统。但沙子的磁性特征反而加剧了能量的波动。"影像继续播放,展示了城市居民们绝望的尝试:工程师们在地下室忙碌,试图修复系统;科学家们在实验室里进行最后的计算;普通市民则聚集在广场上祈祷。但一切都太迟了。"最后的记录显示,"萨拉的声音有些颤抖,"他们在满月之夜启动了紧急关闭程序。但能量已经积累到了临界点..."投影中,整个城市被一道耀眼的白光吞没,然后...什么都没有了。杰森突然意识到什么:"等等,如果系统没有完全关闭,而是进入了某种休眠状态..."他转向汤姆,"这就是为什么艾哈迈德会突然消失!系统可能还在运作,只是以一种我们无法理解的方式。"就在这时,他们听到远处传来熟悉的机械轰鸣声,就像他们在营地外听到的那样。地面开始轻微震动,墙壁上的晶体发出不稳定的光芒。萨拉惊恐地发现,羊皮纸上的符号正在快速变化,就像是在进行某种倒计时...第四章:求生与脱险"快跑!"杰森大喊,拉着萨拉就往通道方向冲去。地面开始剧烈震动,墙壁上的晶体发出刺目的红光,空气中弥漫着臭氧的味道。汤姆跑在最前面开路,阿里紧随其后。突然,通道开始扭曲变形,就像被某种力量拉伸。"这不是普通的震动!"萨拉惊呼,"整个空间结构都在改变!"就在这时,阿里突然停下脚步,指着前方:"看!"只见通道尽头出现了一道光幕,就像他们之前看到的全息投影,但这次是实体的。汤姆试图用手触碰,却被一股强大的力量弹了回来。"这是能量屏障!"杰森迅速掏出羊皮纸,"也许我们能找到关闭它的方法..."但羊皮纸上的符号正在快速消失,就像被什么东西擦除一样。突然,身后传来一声巨响。他们回头一看,发现来时的路已经被坍塌的墙壁堵死。更糟糕的是,空气中开始出现细小的光点,就像萤火虫一样漂浮着。"别碰那些光点!"萨拉警告道,"它们是能量溢出形成的等离子体,温度极高!"就在这时,汤姆突然指着地面:"看这些符号!"原来地面上浮现出一串发光的符号,和羊皮纸上的一模一样。"这是...逃生路线!"杰森恍然大悟,"城市在指引我们!"他们沿着符号指示的方向狂奔,但光点越来越多,温度急剧上升。阿里突然绊了一跤,一个光点擦过他的手臂,立刻烧出了一个焦黑的痕迹。"坚持住!"杰森扶起阿里,"前面就是出口了!"但出口处却出现了一道新的屏障。萨拉仔细观察着屏障上的符号:"这是最后一道考验...我们需要同时触碰四个角落的符号!"四人分头行动,但光点已经形成了一个包围圈。就在他们即将被吞噬的瞬间,四人同时触碰了符号。屏障消失了,但身后的能量波动已经形成了一个漩涡,开始吞噬周围的一切。"跳!"杰森大喊。他们纵身一跃,穿过出口的瞬间,身后的通道轰然坍塌。刺眼的阳光扑面而来,他们重重地摔在沙地上。当他们挣扎着站起来时,发现身后的沙丘正在以惊人的速度下陷,形成一个巨大的漏斗。整个地下城市正在自我毁灭。"艾哈迈德!"萨拉突然指着远处。只见艾哈迈德正踉踉跄跄地从另一个出口跑出来,身上布满了奇怪的符号。"快跑!"杰森冲过去扶住他。五人拼命奔跑,直到身后的沙尘暴渐渐平息。当他们终于停下来时,发现已经站在了沙漠的边缘。杰森回头望向那片曾经隐藏着秘密的沙海,现在只剩下一个巨大的凹陷。他摸了摸口袋里的羊皮纸,发现它已经变成了一堆灰烬。"也许..."萨拉轻声说,"有些秘密注定要永远埋藏在沙漠之下。"杰森点点头,但嘴角却露出一丝神秘的微笑。他悄悄握紧了拳头,里面是一小块发光的晶体——那是他在最后时刻从墙上抠下来的。他知道,这场冒险远未结束...created by AI