# AIAS **Repository Path**: smartwell/AIAS ## Basic Information - **Project Name**: AIAS - **Description**: AIAS (AI Acceleration Suite) - 人工智能加速器套件。提供: 包括SDK,平台引擎,场景套件在内,合计超过100个项目组成的项目集。 - **Primary Language**: Java - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1077 - **Created**: 2024-05-20 - **Last Updated**: 2025-02-07 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README
中文 | English
|
|
|
|
|
OCR工具箱 1:OCR方向检测与旋转 - ocr_sdks/ocr_direction_det_sdk OCR图像预处理。 |
|
|
OCR工具箱 2:OCR文字识别 - ocr_sdks/ocr_v3_sdk 1. V3 文本检测:- 中文文本检测 - 英文文本检测 - 多语言文本检测 2. V3 文本识别: - 中文简体 - 中文繁体 - 英文 - 韩语 - 日语 - 阿拉伯 - 梵文 - 泰米尔语 - 泰卢固语 - 卡纳达文 - 斯拉夫 |
|
|
OCR工具箱 3:OCR文字识别 - ocr_sdks/ocr_v4_sdk 原生支持旋转倾斜文本文字识别。 |
|
|
OCR工具箱 4:版面分析 - ocr_sdks/ocr_layout_sdk 可以用于配合文字识别,表格识别的流水线处理使用。1. 中文版面分析 2. 英文版面分析 3. 中英文文档 - 表格区域检测 |
|
|
OCR工具箱 5: 表格识别 - ocr_sdks/ocr_table_sdk 中英文表格识别。 |
|
|
OCR工具箱 6: led文字识别 - ocr_sdks/ocr_led_sdk led表盘文字识别。 |
|
|
动物分类识别 - classification/animal_sdk 动物识别sdk,支持7978种动物的分类识别。 |
|
|
菜品分类识别 - classification/dish_sdk 菜品识别sdk,支持8416种菜品的分类识别。 |
|
|
单目深度估计 - depth_estimation_sdk MiDaS_Small实现单目深度估计,模型可通过输入图像估计其中的深度信息。 |
|
|
动作驱动 - first_order_sdk sdk以一段动作视频去驱动一张图片运动。可以驱动任意类型的运动。 |
|
|
实例分割 - instance_segmentation_sdk 支持对图片中80个分类的目标进行实例分割。 |
|
|
人群密度检测 - crowd_sdk 统计人数,计算密度图。 |
|
|
烟火检测 - fire_smoke_sdk 烟火检测,给出检测框和置信度。 |
|
|
口罩检测 - mask_sdk 口罩检测,给出检测框。 |
|
|
行人检测 - pedestrian_sdk 行人检测,给出检测框和置信度。 |
|
|
反光衣检测 - reflective_vest_sdk 实现施工区域或者危险区域人员穿戴检测。 |
|
|
智慧工地检测 - smart_construction_sdk 支持检测的类别:人体,安全帽。 |
|
|
车辆检测 - vehicle_sdk 车辆检测,给出检测框和置信度。 |
|
|
轻量句向量SDK【英文】 - embedding/sentence_encoder_en_sdk 句向量是指将语句映射至固定维度的实数向量。 |
|
|
词向量SDK【英文】- embedding/word_encoder_en_sdk 每个单词或词组被映射为实数域上的向量。 |
|
|
fastText - kits/fasttext_sdk fastText是一个快速文本分类算法。 |
|
|
解析npy/npz文件 - kits/npy_npz_sdk java读取python numpy保存的npz、npy文件。。 |
|
|
Sentencepiece分词 - kits/sentencepiece_sdk Sentencepiece分词的Java实现。 |
|
|
jieba分词 - lexical_analysis/jieba_sdk jieba分词java版本的简化实现。 |
|
|
词法分析SDK [中文] - lexical_analysis/lac_sdk 词法分析模型能整体性地完成中文分词、词性标注、专名识别任务。 |
|
|
短文本相似度SDK [中文] - semantic_simnet_bow_sdk 计算两个句子的cosin相似度。 |
|
|
情感分析SDK [中文]- sentiment_analysis/senta_bilstm_sdk 判断该文本的情感极性类别并给出相应的置信度。 |
|
|
对话情绪识别SDK [中文] - sentiment_analysis/senta_textcnn_sdk 对话情绪识别(Emotion Detection)专注于识别智能对话场景中用户的情绪, 针对智能对话场景中的用户文本,自动判断该文本的情绪类别并给出相应的置信度。 |
|
|
情感倾向分析SDK - sentiment_analysis/sentiment_analysis_sdk 情感倾向分析(Sentiment Classification)针对带有主观描述的中文文本,可自动判断该文本的情感极性类别并给出相应的置信度。 |
|
|
文本审核SDK [中文] - porn_detection_sdk 色情检测模型可自动判别文本是否涉黄并给出相应的置信度,对文本中的色情描述、低俗交友、污秽文爱进行识别。 |
|
|
中文翻译为英文 - translation_zh_en_sdk 中文翻译为英文SDK。 |
|
|
语音识别(ASR)【短语音】 - asr_sdk 中文语音识别。 |
|
|
语音处理包Librosa- librosa_sdk python语音处理库librosa的java实现。 |
|
|
音素相关的文本处理- ph_sdk 音素相关的文本处理工具箱。适用于中文、英文和中英混合的音素,其中汉字拼音采用清华大学的音素, 英文字符分字母和英文。 |
|
|
音特征编码器提取特征向量 - sv2tts_speakencoder_sdk 声音特征编码器。 |
|
|
提取mel(梅尔)频谱 - tacotron_stft_sdk TacotronSTFT 提取mel(梅尔)频谱。 |
|
|
基于目标音色的梅尔频谱图 - tacotron2_sdk 模型生成文本基于目标音色的梅尔频谱图。 |
|
|
TTS 文本转为语音 - tts_sdk TTS 文本转为语音。 |
|
|
声纹识别 - voiceprint_sdk 声纹特征向量提取,声纹相似度计算。 |
|
|
摄像头口罩检测 - camera_facemask_sdk 读取本地摄像头,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。 |
|
|
MP4检测口罩 - mp4_facemask_sdk 读取本地MP4文件,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。 |
|
|
rtsp取流检测口罩 - rtsp_facemask_sdk 通过rtsp取流,实时(需要有显卡的台式机,否则会比较卡顿)检测口罩。 |
|
|
flink-情感倾向分析【英文】SDK - flink_sentiment_analysis_sdk 情感倾向分析(Sentiment Classification) 针对带有主观描述的文本,可自动判断该文本的情感极性类别并给出相应的置信度。 |
|
|
kafka-情感倾向分析【英文】SDK - kafka_sentiment_analysis_sdk 情感倾向分析(Sentiment Classification) 针对带有主观描述的文本,可自动判断该文本的情感极性类别并给出相应的置信度。 |
|
|
2D虚拟人APP - Live2DDemo 最近元宇宙的概念越来越火。虚拟人技术是其中重要的组成部分。 其原理是通过视频来捕捉人脸,并且将人的面部动作同步到人物身上。人们只需要一个摄像头就可以制造出一个生动活泼的虚拟形象了。 |
|
|
AI 训练平台 - training AI训练平台提供分类模型训练能力。并以REST API形式为上层应用提供接口。 |
|
|
java版StableDiffusion - stable_diffusion 文生图:输入提示词(仅支持英文),生成图片(仅支持英文) 图生图:根据图片及提示词(仅支持英文)生成图片 |
|