人工智能 - 圣賢書院 - 圣賢,圣賢書,讀書,閱讀,免費的大型圖書館平臺

<source id="kqqcq"></source>

<legend id="kqqcq"></legend>

《人工智能》

前言
AI模型框架-地址庫

Attention Is All You Need 注意?是你所需要的

yolo相關內容
數據中心
BCC漢語語料庫
理論知識
大名鼎鼎的GPT的名字解釋

大語言模型（LLM）

點積，內積，數量積的定義

Transformer一篇通

解讀AI大模型，從了解token開始

矩陣和矩陣相乘怎么計算

softmax函數歸一化指數函數

統計語言模型（Bigram建模訓練））

人工智能的黎明：從信息動力學的角度看ChatGPT
基本安裝
安裝torch和cuda
基本知識
【大語言模型LLM】-基礎語言模型和指令微調的語言模型

【大語言模型LLM】-大語言模型如何編寫Prompt?
Transformer
深入理解 Transformer 技術原理
脈沖神經網絡 (SNN)
脈沖神經網絡 (Spiking Neural Network) 解讀 (一)
數據處理
chartjs：新出的圖標展示框架

常用數據git
聲音處理
FunASR：阿里的語音識別

Kaldi：ASR，語音識別，可以訓練聲學模型

星辰語音識別開源大模型：中國電信，【超多方言】ASR

最難方言溫州話被攻克！中國電信語音大模型支持30種方言

播放音頻文件

讓 Python 來幫你朗讀網頁吧

從零開始搭建一個語音對話機器人

Seed-TTS：字節發布高性能高逼真語音合成框架

ChatTTS：語音合成

edge-tts：語音合成，調用的微軟edge的在線語音合成服務

pyttsx3：語音轉換

python實現TTS離線語音合成

StyleTTS2：one-shot語音風格遷移和逼真語音轉換的論文閱讀和代碼實戰

Matcha-TTS：語音合成，

Bailing-TTS：巨人網絡支持普通話和方言混說的TTS大模型
圖像處理
SAT：開源3D醫學大模型SAT，性能超越72個nnU-Nets，上交大團隊發布

EasyPhoto：阿里的您的智能 AI 照片生成器
視頻處理
EasyAnimate：阿里高分辨率長視頻生成的端到端解決方案

Tora:阿里的簡單幾筆快速生成精確運動控制的視頻

LivePortrait：快手視頻驅動照片或視頻，可以復制面部表情

Champ:阿里發布的人物圖片+視頻轉換為合成視頻

Hallo:復旦大學音頻+人臉圖像=視頻生成模型
文字處理
多模處理
VASA-1：實時音頻驅動的超逼數字人說話面部視頻生成技術

EchoMimic:阿里的數字人生成，語音和視頻合成

MuseTalk：騰訊的AI數字人口型同步工具
動態記憶和自我反思
Reflexion：具有動態記憶和自我反思的自主代理

百度生產一個反思功能代碼python
論文精選
2023年4月的12篇AI論文推薦

2023年12月論文推薦

論文解讀

Seed-TTS: A Family of High-Quality Versatile Speech Generation Models
大模型LLM
本地搭建私有大模型平臺

Stability AI發布AI音頻模型Stable Audio Open，音樂制作

通義千問：qwen

Qwen2：阿里通義千問2.0出來了，大模型升級了

huggingface的模型文件的目錄結構
AIAgent
新一代AI模型Claude 3：有大學生智商，全面超越GPT-4

FastChat——一個用于訓練、部署和評估基于大型語言模型的聊天機器人的開放平臺

谷歌DeepMind推出新一代藥物研發AI模型AlphaFold 3

LangChain-Chatchat (原 Langchain-ChatGLM)

MaxKB本地私有大模型部署

YOLO v10視覺目標檢測算法本地端部署

Fay數字人框架助理版

百度開源 / Senta - 情感分析旨

Moshi：法國的ai研究者Kyutai推出開源實時語音多模態模型

GraphRAG：微軟開源的下一代 RAG 技術

Move AI 推出 Move API，實現 2D 視頻轉 3D 運動數據

Cloudflare 推出一鍵阻止 AI 機器人的新工具

騰訊開源混元 Captioner 模型，優化文生圖數據集生成

改變答題順序會顯著降低大模型準確率

OpenDevin：卡內基梅隆大學教授創立 All Hands AI，推出開源 AI 軟件代理 OpenDevin

漆遠創立無限光年，獲阿里投資進軍可信大模型賽道

阿里發布 FunAudioLLM 開源項目，推出 SenseVoice 和 CosyVoice 兩大語音模型

快手文生圖大模型 Kolors 宣布開源

商湯科技發布 InternLM-XComposer2.5 視覺語言模型

穹徹智能推出具身大腦 Noematrix Brain，聚焦操作物理常識與行為決策

華中科技大學等團隊推出 Holmes-VAD，實現視頻異常檢測與解釋

可靈AI/Kling：快手視頻生成大模型可靈 AI Kling

徹底改變語言模型：全新架構TTT，ML模型代替RNN隱藏狀態

新型TTT架構誕生，能否取代Transformer和Mamba成為最強大模型？

DG4D/DreamGaussian4D：四維建模及運動控制模型

CosyVoice:阿里的語音生成，支持多語言、音色和情感控制

SenseVoice ：阿里語音識別、語種識別、情感識別、聲學事件分類或檢測

Seed-TTS：字節的的語音生成，太逼真太形象了

Fish-Speech：開源的TTS項目，語音生成

ollama:大模型運行平臺，支持cpu運行大模型

當實時數字人遇上LLM

CMD 下的基本指令

語音對話大模型：借助阿里的FunAudioLLM搭建語音對話模型

CogVideo：智譜版Sora開源爆火，4090單卡運行，A6000可微調
功能模塊

國學

人工智能

簡介：人工智能

發布時間： 2024-01-06 21:52:19

最后修改： 2024-01-06 21:52:19

圣賢書院

圣賢書院

肉人妻丰满av无码久久不卡_国产成人精品无码片区_国产69精品久久久久9999_国产内射XXXXX

<source id="kqqcq"></source>

<legend id="kqqcq"></legend>