ocr.py 924 B

123456789101112131415161718192021222324
  1. """
  2. OCR识别配置
  3. """
  4. # OCR配置 - 使用llama-server API
  5. OCR_CONFIG = {
  6. 'use_llama_api': True, # 使用llama-server API
  7. 'api_host': 'localhost', # API服务器地址
  8. 'api_port': 8111, # API端口
  9. 'model': 'PaddleOCR-VL-1.5-GGUF.gguf', # 模型名称
  10. 'prompt': '请识别图片中的数字编号,只返回数字,不要其他内容', # OCR提示词
  11. 'temperature': 0.3, # 温度参数
  12. 'timeout': 30, # 超时时间(秒)
  13. }
  14. # 人体分割模型配置
  15. SEGMENTATION_CONFIG = {
  16. # 模型路径 - 支持 RKNN 格式 (RK3588 平台)
  17. 'model_path': '/home/admin/dsh/testrk3588/yolov8n-seg.rknn',
  18. 'model_type': 'rknn', # 模型类型: 'rknn'
  19. 'input_size': (640, 640), # 模型输入尺寸
  20. 'conf_threshold': 0.5, # 分割置信度阈值
  21. 'use_npu': True, # 使用 NPU 加速
  22. }