首頁
讀書
古詩詞
發現
電子書下載
思維
中醫
內參
武術
游記
課程
排行榜
知識庫
工具下載
CTF
眾測
峰會
20年
商城
論壇
注冊
|
登錄
首頁
讀書
網課
發現
素材庫
電子書下載
文摘
思維
中醫
武術
內參
詩詞
游記
我的
我的書籍
我的書架
我的訂單
我的網課
個人中心
管理中心
消息
《人工智能》
前言
AI模型框架-地址庫
Attention Is All You Need 注意?是你所需要的
yolo相關內容
數據中心
BCC漢語語料庫
理論知識
大名鼎鼎的GPT的名字解釋
大語言模型(LLM)
點積,內積,數量積的定義
Transformer一篇通
解讀AI大模型,從了解token開始
矩陣和矩陣相乘怎么計算
softmax函數歸一化指數函數
統計語言模型(Bigram建模訓練))
人工智能的黎明:從信息動力學的角度看ChatGPT
基本安裝
安裝torch和cuda
基本知識
【大語言模型LLM】-基礎語言模型和指令微調的語言模型
【大語言模型LLM】-大語言模型如何編寫Prompt?
Transformer
深入理解 Transformer 技術原理
脈沖神經網絡 (SNN)
脈沖神經網絡 (Spiking Neural Network) 解讀 (一)
數據處理
chartjs:新出的圖標展示框架
常用數據git
聲音處理
FunASR:阿里的語音識別
Kaldi:ASR,語音識別,可以訓練聲學模型
星辰語音識別開源大模型:中國電信,【超多方言】ASR
最難方言溫州話被攻克!中國電信語音大模型支持30種方言
播放音頻文件
讓 Python 來幫你朗讀網頁吧
從零開始搭建一個語音對話機器人
Seed-TTS:字節發布高性能高逼真語音合成框架
ChatTTS:語音合成
edge-tts:語音合成,調用的微軟edge的在線語音合成服務
pyttsx3:語音轉換
python實現TTS離線語音合成
StyleTTS2:one-shot語音風格遷移和逼真語音轉換的論文閱讀和代碼實戰
Matcha-TTS:語音合成,
Bailing-TTS:巨人網絡支持普通話和方言混說的TTS大模型
圖像處理
SAT:開源3D醫學大模型SAT,性能超越72個nnU-Nets,上交大團隊發布
EasyPhoto:阿里的您的智能 AI 照片生成器
視頻處理
EasyAnimate:阿里高分辨率長視頻生成的端到端解決方案
Tora:阿里的簡單幾筆快速生成精確運動控制的視頻
LivePortrait:快手視頻驅動照片或視頻,可以復制面部表情
Champ:阿里發布的人物圖片+視頻轉換為合成視頻
Hallo:復旦大學音頻+人臉圖像=視頻生成模型
文字處理
多模處理
VASA-1:實時音頻驅動的超逼數字人說話面部視頻生成技術
EchoMimic:阿里的數字人生成,語音和視頻合成
MuseTalk:騰訊的AI數字人口型同步工具
動態記憶和自我反思
Reflexion:具有動態記憶和自我反思的自主代理
百度生產一個反思功能代碼python
論文精選
2023年4月的12篇AI論文推薦
2023年12月 論文推薦
論文解讀
Seed-TTS: A Family of High-Quality Versatile Speech Generation Models
大模型LLM
本地搭建私有大模型平臺
Stability AI發布AI音頻模型Stable Audio Open,音樂制作
通義千問:qwen
Qwen2:阿里通義千問2.0出來了,大模型升級了
huggingface的模型文件的目錄結構
AIAgent
新一代AI模型Claude 3:有大學生智商,全面超越GPT-4
FastChat——一個用于訓練、部署和評估基于大型語言模型的聊天機器人的開放平臺
谷歌DeepMind推出新一代藥物研發AI模型AlphaFold 3
LangChain-Chatchat (原 Langchain-ChatGLM)
MaxKB本地私有大模型部署
YOLO v10視覺目標檢測算法本地端部署
Fay數字人框架 助理版
百度開源 / Senta - 情感分析旨
Moshi:法國的ai研究者Kyutai推出開源實時語音多模態模型
GraphRAG:微軟開源 的下一代 RAG 技術
Move AI 推出 Move API,實現 2D 視頻轉 3D 運動數據
Cloudflare 推出一鍵阻止 AI 機器人的新工具
騰訊開源混元 Captioner 模型,優化文生圖數據集生成
改變答題順序會顯著降低大模型準確率
OpenDevin:卡內基梅隆大學教授創立 All Hands AI,推出開源 AI 軟件代理 OpenDevin
漆遠創立無限光年,獲阿里投資進軍可信大模型賽道
阿里發布 FunAudioLLM 開源項目,推出 SenseVoice 和 CosyVoice 兩大語音模型
快手文生圖大模型 Kolors 宣布開源
商湯科技發布 InternLM-XComposer2.5 視覺語言模型
穹徹智能推出具身大腦 Noematrix Brain,聚焦操作物理常識與行為決策
華中科技大學等團隊推出 Holmes-VAD,實現視頻異常檢測與解釋
可靈AI/Kling:快手視頻生成大模型 可靈 AI Kling
徹底改變語言模型:全新架構TTT,ML模型代替RNN隱藏狀態
新型TTT架構誕生,能否取代Transformer和Mamba成為最強大模型?
DG4D/DreamGaussian4D:四維建模及運動控制模型
CosyVoice:阿里的語音生成,支持多語言、音色和情感控制
SenseVoice :阿里語音識別、語種識別、情感識別、聲學事件分類或檢測
Seed-TTS:字節的的語音生成,太逼真太形象了
Fish-Speech:開源的TTS項目,語音生成
ollama:大模型運行平臺,支持cpu運行大模型
當實時數字人遇上LLM
CMD 下的基本指令
語音對話大模型:借助阿里的FunAudioLLM搭建語音對話模型
CogVideo:智譜版Sora開源爆火,4090單卡運行,A6000可微調
功能模塊
暫無章節
國學
人工智能
放入書架
開始閱讀
簡介:人工智能
更多
發布時間:
2024-01-06 21:52:19
最后修改:
2024-01-06 21:52:19
圣賢書院
圣賢書院
肉人妻丰满av无码久久不卡_国产成人精品无码片区_国产69精品久久久久9999_国产内射XXXXX