学院/AI应用开发/动手搭建你的第一个AI应用
免费章节 13分钟Chapter 2/5

动手搭建你的第一个AI应用

用Python + 大模型API从零构建一个实用的AI工具

本章学习要点

2 / 5
1

理解AI应用开发的定义与市场定位

2

掌握AI应用的核心技术栈(API/SDK/框架)

3

区分AI应用的四种形态(聊天/嵌入/Agent/端到端)

4

了解AI应用开发者的职业前景与薪资水平

理论讲完了,让我们动手做一个真正的AI应用。这一章我们将用Python + DeepSeek API从零搭建一个「智能文档问答助手」——上传文档后,AI能基于文档内容回答问题。这是最实用也最常见的AI应用形态。

环境准备

安装Python

如果你还没有Python环境,推荐使用Anaconda(集成了大量科学计算库)或直接从python.org下载安装最新版本。安装时勾选「Add to PATH」选项。

获取API Key

以DeepSeek为例:访问platform.deepseek.com,注册账号后在API管理页面创建API Key。DeepSeek提供免费额度供开发测试,足够你完成本章的所有练习。如果你更习惯使用OpenAI,流程类似,访问platform.openai.com即可。

安装依赖

在终端运行以下命令安装必要的库:`pip install openai streamlit python-docx PyPDF2`。其中openai库不仅支持OpenAI,大部分兼容OpenAI接口格式的大模型(包括DeepSeek)都可以直接使用这个库。

第一步:最简单的API调用

打开Cursor或VS Code,创建一个新的Python文件。写一个最基础的API调用,让AI回答一个问题。核心代码只有几行:创建client、设置model和messages、发送请求、打印结果。

这里有一个关键概念——**messages数组**。它包含对话的完整上下文:system消息定义AI的角色和行为规范,user消息是用户的输入,assistant消息是AI的回复。通过维护这个数组,你可以实现多轮对话记忆。

调试技巧

如果遇到报错,90%的情况是:API Key没设置对、网络连接问题(国内访问OpenAI需要代理)、或者模型名称拼写错误。让Cursor的AI帮你debug是最快的方式。

第二步:添加系统提示词

一个好的AI应用和一个普通的API调用之间的差距,往往就在系统提示词上。系统提示词定义了AI的身份、能力范围和行为规范。

**实战案例**:假设你在做一个外贸开发信助手,系统提示词应该包含:「你是一个专业的外贸业务专家,擅长写B2B开发信。你的写作风格简洁专业,避免过度推销。所有邮件必须包含公司价值主张、针对客户行业的定制化内容和明确的CTA。如果用户没有提供足够的信息,你应该主动询问。」

第三步:构建文档问答功能

现在进入核心功能——让AI基于上传的文档来回答问题。基本思路是:读取文档内容 → 把文档内容和用户问题一起发给AI → AI基于文档回答。

文档读取

用python-docx读取Word文件,用PyPDF2读取PDF文件。核心就是把文档中的文字提取出来变成一个字符串。对于短文档(几千字以内),可以直接把全部内容放到prompt中。

处理长文档

当文档超过模型的上下文窗口(DeepSeek支持64K token)时,你需要做文本切分:把长文档切成多个小段落,只把与用户问题最相关的段落发给AI。这就是RAG(检索增强生成)的基本原理。简单版本可以用关键词匹配,进阶版本用向量相似度搜索。

第四步:用Streamlit做界面

命令行工具只适合自己用,要给别人用需要一个Web界面。Streamlit是最简单的Python Web框架——几行代码就能做出一个可交互的网页。

核心组件:`st.file_uploader`让用户上传文档、`st.text_input`让用户输入问题、`st.chat_message`展示对话历史。运行`streamlit run app.py`就能在浏览器中看到你的应用。

部署上线

本地跑通后,可以用以下方式部署让其他人也能访问:**Streamlit Cloud**(免费,直接从GitHub部署)、**Railway**(简单的云部署平台)、**阿里云函数计算/腾讯云云函数**(国内方案,按调用次数付费)。

第五步:迭代优化

基础版本跑起来后,可以继续优化:添加对话历史记忆(记住上下文)、支持多种文件格式(Excel、Markdown等)、添加流式输出(像ChatGPT一样逐字显示)、加入错误处理和加载状态提示。

每一步优化都可以让AI帮你写代码。在Cursor中描述你想要的功能,它会基于你现有的代码生成改进方案。

学习建议

不要试图一次把所有功能做完美。先让最简单的版本跑起来,然后逐步迭代。每次只加一个功能,确保可以运行后再加下一个。这种增量开发的方式在AI辅助编程中效率最高——AI对小范围的修改生成代码的质量远高于一次性生成一个大项目。

实用建议

AI应用开发的关键原则是增量迭代:先让最简单的版本跑起来(哪怕只是一个API调用),然后逐步添加功能。每次只加一个功能确保可运行后再加下一个,AI对小范围修改的代码质量远高于一次性大项目。

注意事项

API Key是你的AI应用的「钥匙」,绝对不能硬编码在代码中或上传到GitHub。使用环境变量(.env文件)来管理API Key,并在.gitignore中排除.env文件。泄露的API Key可能导致巨额费用。

重要提醒

一个好的AI应用和普通API调用之间的差距,往往就在系统提示词(System Prompt)上。花时间打磨系统提示词——定义清晰的身份、能力范围和行为规范——是提升应用质量最有效的方式。

RAG文档问答系统架构

上传文档
文本提取和切分
向量化存储
用户提问检索
AI基于文档回答

AI应用开发五步法

最简API调用
添加系统提示词
构建核心功能(RAG)
Streamlit做界面
部署上线

章节测验

1/3

1RAG(检索增强生成)的基本原理是什么?

完成了第一个AI应用后,下一章我们将进入更前沿的领域——AI智能体开发,让AI不仅能回答问题,还能自主执行复杂任务。

学完了吗?标记为已完成

完成所有章节后可获得证书

想解锁全部课程内容?

购买完整学习包,获得所有章节 + 认证指南 + 求职模板

查看完整课程