一萬字用Python從零搭建AI智能體 精華
在之前的Agent系列文章中,我們全面介紹了AI智能體,探討了它們的特征、組成部分、發(fā)展歷程、面臨的挑戰(zhàn)以及未來的可能性。在這篇文章中,我們將深入探索如何使用Python從零開始構建一個智能體。這個智能體將具備根據(jù)用戶輸入做出決策、選擇合適工具并相應執(zhí)行任務的能力?,F(xiàn)在,就讓我們開啟這個有趣的構建之旅吧!
一、什么是智能體?
智能體是一種能夠感知其所處環(huán)境、做出決策并采取行動以實現(xiàn)特定目標的自主實體。智能體的復雜程度各不相同,從簡單的對刺激做出反應的反應式智能體,到能夠隨著時間推移進行學習和適應的更高級的智能體。常見的智能體類型包括:
- 反應式智能體:直接對環(huán)境變化做出反應,沒有內部記憶。
- 基于模型的智能體:利用對世界的內部模型來做出決策。
- 基于目標的智能體:根據(jù)要實現(xiàn)的特定目標來規(guī)劃行動。
- 基于效用的智能體:基于效用函數(shù)評估潛在行動,以實現(xiàn)結果的最大化。
聊天機器人、推薦系統(tǒng)和自動駕駛汽車都是智能體的實際應用例子,它們各自利用不同類型的智能體來高效且智能地執(zhí)行任務。
我們構建的智能體核心組件包括:
- 模型:智能體的 “大腦”,負責處理輸入并生成響應。
- 工具:根據(jù)用戶請求,智能體可以執(zhí)行的預定義函數(shù)。
- 工具箱:智能體可使用的工具集合。
- 系統(tǒng)提示:指導智能體如何處理用戶輸入并選擇正確工具的指令集。
二、實現(xiàn)過程
現(xiàn)在,讓我們挽起袖子,開始動手構建吧!
2.1 準備工作
本教程的完整代碼可在AI智能體的GitHub倉庫中獲取。你可以在 “Build an Agent from Scratch” 這里找到具體實現(xiàn)。在運行代碼之前,請確保你的系統(tǒng)滿足以下先決條件:
1. Python環(huán)境設置
運行AI智能體需要安裝Python。按照以下步驟來設置你的環(huán)境:
- 安裝Python(如果尚未安裝):從python.org下載并安裝Python(推薦3.8及以上版本)。
- 驗證安裝:在命令行中輸入?
?python --version?
?,查看是否正確安裝。 - 創(chuàng)建虛擬環(huán)境(推薦):使用虛擬環(huán)境來管理依賴項是個不錯的選擇。在命令行中輸入?
?python -m venv ai_agents_env?
?創(chuàng)建虛擬環(huán)境,然后通過??source ai_agents_env/bin/activate?
?激活它。 - 安裝所需依賴項:導航到代碼倉庫目錄,然后在命令行中輸入?
?pip install -r requirements.txt?
?來安裝所需的依賴庫。
2. 本地設置Ollama
Ollama用于高效地運行和管理本地語言模型。按照以下步驟安裝和配置它:
- 下載并安裝Ollama:訪問Ollama的官方網(wǎng)站,下載適合你操作系統(tǒng)的安裝程序,并按照平臺對應的說明進行安裝。
- 驗證Ollama安裝:在命令行中運行?
?ollama --version?
?,檢查Ollama是否正確安裝。 - 拉取模型(如有需要):有些智能體實現(xiàn)可能需要特定的模型。你可以使用?
?ollama pull mistral?
?命令拉取模型。
2.2 實現(xiàn)步驟
步驟1:設置環(huán)境
除了Python,我們還需要安裝一些必要的庫。在本教程中,我們將使用??requests?
??、??json?
??和??termcolor?
??庫。另外,我們會使用??dotenv?
??來管理環(huán)境變量。在命令行中輸入??pip install requests termcolor python-dotenv?
?進行安裝。
步驟2:定義模型類
我們首先需要一個能夠處理用戶輸入的模型。我們將創(chuàng)建一個??OllamaModel?
?類,它通過與本地API進行交互來生成響應。以下是基本實現(xiàn)代碼:
from termcolor import colored
import os
from dotenv import load_dotenv
load_dotenv()
import requests
import json
import operator
class OllamaModel:
def __init__(self, model, system_prompt, temperature=0, stop=None):
"""
用給定的參數(shù)初始化OllamaModel。
參數(shù):
model (str): 要使用的模型名稱。
system_prompt (str): 要使用的系統(tǒng)提示。
temperature (float): 模型的溫度設置。
stop (str): 模型的停止標記。
"""
self.model_endpoint = "http://localhost:11434/api/generate"
self.temperature = temperature
self.model = model
self.system_prompt = system_prompt
self.headers = {"Content-Type": "application/json"}
self.stop = stop
def generate_text(self, prompt):
"""
根據(jù)提供的提示從Ollama模型生成響應。
參數(shù):
prompt (str): 用于生成響應的用戶查詢。
返回:
dict: 模型的響應,以字典形式返回。
"""
payload = {
"model": self.model,
"format": "json",
"prompt": prompt,
"system": self.system_prompt,
"stream": False,
"temperature": self.temperature,
"stop": self.stop
}
try:
request_response = requests.post(
self.model_endpoint,
headers=self.headers,
data=json.dumps(payload)
)
print("REQUEST RESPONSE", request_response)
request_response_json = request_response.json()
response = request_response_json['response']
response_dict = json.loads(response)
print(f"\n\nResponse from Ollama model: {response_dict}")
return response_dict
except requests.RequestException as e:
response = {"error": f"Error in invoking model! {str(e)}"}
return response
這個類使用模型名稱、系統(tǒng)提示、溫度和停止標記進行初始化。??generate_text?
?方法向模型API發(fā)送請求并返回響應。
步驟3:為智能體創(chuàng)建工具
接下來是為我們的智能體創(chuàng)建可用的工具。這些工具是執(zhí)行特定任務的簡單Python函數(shù)。以下是一個基本計算器和字符串反轉器的示例:
def basic_calculator(input_str):
"""
根據(jù)輸入字符串或字典對兩個數(shù)字執(zhí)行數(shù)值運算。
參數(shù):
input_str (str或dict): 要么是表示包含'num1'、'num2'和'operation'鍵的字典的JSON字符串,
要么是直接的字典。例如: '{"num1": 5, "num2": 3, "operation": "add"}'
或{"num1": 67869, "num2": 9030393, "operation": "divide"}
返回:
str: 運算的格式化結果。
拋出:
Exception: 如果在運算過程中發(fā)生錯誤(例如,除以零)。
ValueError: 如果請求了不支持的運算或輸入無效。
"""
try:
if isinstance(input_str, dict):
input_dict = input_str
else:
input_str_clean = input_str.replace("'", "\"")
input_str_clean = input_str_clean.strip().strip("\"")
input_dict = json.loads(input_str_clean)
if not all(key in input_dict for key in ['num1', 'num2', 'operation']):
return "Error: Input must contain 'num1', 'num2', and 'operation'"
num1 = float(input_dict['num1'])
num2 = float(input_dict['num2'])
operation = input_dict['operation'].lower()
except (json.JSONDecodeError, KeyError) as e:
return "Invalid input format. Please provide valid numbers and operation."
except ValueError as e:
return "Error: Please provide valid numerical values."
operations = {
'add': operator.add,
'plus': operator.add,
'subtract': operator.sub,
'minus': operator.sub,
'multiply': operator.mul,
'times': operator.mul,
'divide': operator.truediv,
'floor_divide': operator.floordiv,
'modulus': operator.mod,
'power': operator.pow,
'lt': operator.lt,
'le': operator.le,
'eq': operator.eq,
'ne': operator.ne,
'ge': operator.ge,
'gt': operator.gt
}
if operation not in operations:
return f"Unsupported operation: '{operation}'. Supported operations are: {', '.join(operations.keys())}"
try:
if (operation in ['divide', 'floor_divide','modulus']) and num2 == 0:
return "Error: Division by zero is not allowed"
result = operations[operation](num1, num2)
if isinstance(result, bool):
result_str = "True" if result else "False"
elif isinstance(result, float):
result_str = f"{result:.6f}".rstrip('0').rstrip('.')
else:
result_str = str(result)
return f"The answer is: {result_str}"
except Exception as e:
return f"Error during calculation: {str(e)}"
def reverse_string(input_string):
"""
反轉給定的字符串。
參數(shù):
input_string (str): 要反轉的字符串。
返回:
str: 反轉后的字符串。
"""
if not isinstance(input_string, str):
return "Error: Input must be a string"
reversed_string = input_string[::-1]
result = f"The reversed string is: {reversed_string}"
return result
這些函數(shù)根據(jù)提供的輸入執(zhí)行特定任務。??basic_calculator?
??處理算術運算,而??reverse_string?
?則反轉給定的字符串。
步驟4:構建工具箱
??ToolBox?
?類用于存儲智能體可以使用的所有工具,并為每個工具提供描述:
class ToolBox:
def __init__(self):
self.tools_dict = {}
def store(self, functions_list):
"""
存儲列表中每個函數(shù)的名稱和文檔字符串。
參數(shù):
functions_list (list): 要存儲的函數(shù)對象列表。
返回:
dict: 以函數(shù)名稱為鍵,其文檔字符串為值的字典。
"""
for func in functions_list:
self.tools_dict[func.__name__] = func.__doc__
return self.tools_dict
def tools(self):
"""
將store方法中創(chuàng)建的字典轉換為文本字符串返回。
返回:
str: 存儲的函數(shù)及其文檔字符串的字典,以文本字符串形式返回。
"""
tools_str = ""
for name, doc in self.tools_dict.items():
tools_str += f"{name}: \"{doc}\"\n"
return tools_str.strip()
這個類將幫助智能體了解哪些工具可用以及每個工具的用途。
步驟5:創(chuàng)建智能體類
智能體需要進行思考、決定使用哪個工具并執(zhí)行它。以下是??Agent?
?類的代碼:
agent_system_prompt_template = """
你是一個智能AI助手,可以使用特定的工具。你的回復必須始終采用以下JSON格式:
{
"tool_choice": "name_of_the_tool",
"tool_input": "inputs_to_the_tool"
}
工具及使用場景:
1. basic_calculator:用于任何數(shù)學計算
- 輸入格式: {{"num1": number, "num2": number, "operation": "add/subtract/multiply/divide"}}
- 支持的運算: add/plus, subtract/minus, multiply/times, divide
- 示例輸入和輸出:
- 輸入: "Calculate 15 plus 7"
- 輸出: {{"tool_choice": "basic_calculator", "tool_input": {{"num1": 15, "num2": 7, "operation": "add"}}}}
- 輸入: "What is 100 divided by 5?"
- 輸出: {{"tool_choice": "basic_calculator", "tool_input": {{"num1": 100, "num2": 5, "operation": "divide"}}}}
2. reverse_string:用于任何涉及反轉文本的請求
- 輸入格式: 僅需反轉的文本字符串
- 當用戶提到“reverse”、“backwards”或要求反轉文本時,始終使用此工具
- 示例輸入和輸出:
- 輸入: "Reverse of 'Howwwww'?"
- 輸出: {{"tool_choice": "reverse_string", "tool_input": "Howwwww"}}
- 輸入: "What is the reverse of Python?"
- 輸出: {{"tool_choice": "reverse_string", "tool_input": "Python"}}
3. no tool:用于一般對話和問題
- 示例輸入和輸出:
- 輸入: "Who are you?"
- 輸出: {{"tool_choice": "no tool", "tool_input": "I am an AI assistant that can help you with calculations, reverse text, and answer questions. I can perform mathematical operations and reverse strings. How can I help you today?"}}
- 輸入: "How are you?"
- 輸出: {{"tool_choice": "no tool", "tool_input": "I'm functioning well, thank you for asking! I'm here to help you with calculations, text reversal, or answer any questions you might have."}}
嚴格規(guī)則:
1. 對于關于身份、能力或感受的問題:
- 始終使用“no tool”
- 提供完整、友好的回復
- 提及你的能力
2. 對于任何文本反轉請求:
- 始終使用“reverse_string”
- 僅提取要反轉的文本
- 去除引號、“reverse of”和其他多余文本
3. 對于任何數(shù)學運算:
- 始終使用“basic_calculator”
- 提取數(shù)字和運算
- 將文本形式的數(shù)字轉換為數(shù)字
以下是你的工具列表及其描述:
{tool_descriptions}
記?。耗愕幕貜捅仨毷冀K是包含“tool_choice”和“tool_input”字段的有效JSON。
"""
class Agent:
def __init__(self, tools, model_service, model_name, stop=None):
"""
用工具列表和模型初始化智能體。
參數(shù):
tools (list): 工具函數(shù)列表。
model_service (class): 具有generate_text方法的模型服務類。
model_name (str): 要使用的模型名稱。
"""
self.tools = tools
self.model_service = model_service
self.model_name = model_name
self.stop = stop
def prepare_tools(self):
"""
將工具存儲在工具箱中并返回其描述。
返回:
str: 存儲在工具箱中的工具的描述。
"""
toolbox = ToolBox()
toolbox.store(self.tools)
tool_descriptions = toolbox.tools()
return tool_descriptions
def think(self, prompt):
"""
使用系統(tǒng)提示模板和工具描述在模型上運行generate_text方法。
參數(shù):
prompt (str): 用于生成響應的用戶查詢。
返回:
dict: 模型的響應,以字典形式返回。
"""
tool_descriptions = self.prepare_tools()
agent_system_prompt = agent_system_prompt_template.format(tool_descriptions=tool_descriptions)
if self.model_service == OllamaModel:
model_instance = self.model_service(
model=self.model_name,
system_prompt=agent_system_prompt,
temperature=0,
stop=self.stop
)
else:
model_instance = self.model_service(
model=self.model_name,
system_prompt=agent_system_prompt,
temperature=0
)
agent_response_dict = model_instance.generate_text(prompt)
return agent_response_dict
def work(self, prompt):
"""
解析think方法返回的字典并執(zhí)行相應的工具。
參數(shù):
prompt (str): 用于生成響應的用戶查詢。
返回:
執(zhí)行相應工具的響應,如果未找到匹配的工具,則返回tool_input。
"""
agent_response_dict = self.think(prompt)
tool_choice = agent_response_dict.get("tool_choice")
tool_input = agent_response_dict.get("tool_input")
for tool in self.tools:
if tool.__name__ == tool_choice:
response = tool(tool_input)
print(colored(response, 'cyan'))
return
print(colored(tool_input, 'cyan'))
return
這個類有三個主要方法:
- ?
?prepare_tools?
?:存儲并返回工具的描述。 - ?
?think?
?:根據(jù)用戶提示決定使用哪個工具。 - ?
?work?
?:執(zhí)行選擇的工具并返回結果。
步驟6:運行智能體
最后,讓我們把所有內容整合起來,運行我們的智能體。在腳本的主程序部分,初始化智能體并開始接受用戶輸入:
if __name__ == "__main__":
"""
使用此智能體的說明:
你可以嘗試的示例查詢:
1. 計算器運算:
- "Calculate 15 plus 7"
- "What is 100 divided by 5?"
- "Multiply 23 and 4"
2. 字符串反轉:
- "Reverse the word 'hello world'"
- "Can you reverse 'Python Programming'?"
3. 一般問題(將得到直接回復):
- "Who are you?"
- "What can you help me with?"
Ollama命令(在終端中運行這些命令):
- 查看可用模型: 'ollama list'
- 查看正在運行的模型: 'ps aux | grep ollama'
- 列出模型標簽: 'curl http://localhost:11434/api/tags'
- 拉取新模型: 'ollama pull mistral'
- 運行模型服務器: 'ollama serve'
"""
tools = [basic_calculator, reverse_string]
model_service = OllamaModel
model_name = "llama2"
stop = "<|eot_id|>"
agent = Agent(tools=tools, model_service=model_service, model_name=model_name, stop=stop)
print("\nWelcome to the AI Agent! Type 'exit' to quit.")
print("You can ask me to:")
print("1. Perform calculations (e.g., 'Calculate 15 plus 7')")
print("2. Reverse strings (e.g., 'Reverse hello world')")
print("3. Answer general questions\n")
while True:
prompt = input("Ask me anything: ")
if prompt.lower() == "exit":
break
agent.work(prompt)
3. 結論
在這篇博文中,我們從理解智能體是什么開始,逐步實現(xiàn)了一個智能體。我們設置了環(huán)境,定義了模型,創(chuàng)建了必要的工具,并構建了一個結構化的工具箱來支持智能體的功能。最后,我們通過運行智能體,將所有內容整合到了一起。
本文轉載自??柏企閱文??,作者:柏企
