# PythonBase **Repository Path**: tabortao/PythonBase ## Basic Information - **Project Name**: PythonBase - **Description**: Python基础学习,用于实现其他项目的基础功能。 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: main - **Homepage**: https://gitee.com/tabortao/PythonBase - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-04-23 - **Last Updated**: 2025-06-25 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # PythonBase 项目 Python基础功能学习项目,集成多种AI和文档处理功能。 本项目远程仓库地址:https://gitee.com/tabortao/PythonBase ## 功能特性 - Gemini AI客户端 (支持文本生成、多模态输入、图片生成、音频转录) - OCR功能 (支持PaddleOCR和EasyOCR) - PDF处理 (PDF转图片、PDF内容提取) - OpenAI兼容接口 ## 安装依赖 ```bash pip install -e . ``` ## 配置文件 项目使用`config.toml`作为配置文件,需要配置以下内容: ```toml [google] api_key = "your_api_key" base_url = "https://generativelanguage.googleapis.com/v1beta/openai/" models = ["gemini-pro"] default_model = "gemini-pro" ``` ## 使用示例 ```python from aichat.llm_gemini import GeminiClient # 初始化客户端 gemini = GeminiClient() # 文本生成 for chunk in gemini.text_completion("你好,请介绍一下你自己"): print(chunk, end="", flush=True) # 多模态输入(文本+图片) result = gemini.multimodal_input("这张图片里有什么?", "path/to/image.jpg") print(result) # 音频转录 transcript = gemini.audio_transcription("path/to/audio.m4a") print(transcript) ``` ## 项目结构 ``` src/ ├── aichat/ # AI聊天相关功能 │ └── llm_gemini.py # Gemini客户端实现 docs/ # 项目文档 ``` ## 许可证 MIT License