最近在玩什么?
简单介绍一下comfyui是什么?
花了大概一两个星期时间会基本的使用了,今年三月份的时候玩了一下webui,那时候还觉得生成图片还不怎么样,没想到现在已经进化到还行的阶段了,comfyui和webui都是使用Stable Diffusion模型来实现生图功能的前端交互界面,其中comfyui节点式的布局自由度比webui高,但没有webui那么容易上手。使用下来就是感觉还需要改进,比如生成的图手指变形的问题,偶而出现脸崩,需要配合其他节点来修复,不仅耗时效果也不一定能找到最好的。而生成视频(重绘)电脑就会变成取暖机,嘎嘎响,出来的图片就算同一批次也会出现衣服颜色不一致的情况,就不用说手和脸了,总之就是生成视频的还不成熟。
使用comfyui生成图片和视频
comfyui有着各种不一样的工作流用来实现各种需求,而生成图片的工作也有很多,最简单的就是文生图,然后图生图,图重绘,局部重绘,线稿上色,换背景等。而我比较喜欢文生图抽卡,输入各种提示词来让模型生成图片,比如这样的
巨物恐惧症了有木有?
还有机甲少女🤪(多图预警!!!)
二刺螈国风龙女(死肥宅最爱!)
美女(没人不爱看吧?)
可以看到手指变形问题,但是不影响dog.jpg
上面这些图片全是AI生成的,两三条腿的就不拿出来了/(ㄒoㄒ)/~~怎么样?有没有感觉很棒!再来看看做视频是什么效果?
花了一个星期摸索,修手修脸之类的,脸全修过所以一直闪,也不会剪辑就这样了(摆了)
然后半个月前又有了svd模型出来了,能通过一张图片生成视频,最近玩了一下,下面效果,看到obaby姐用这个存视频,我也来整一个,感觉比b站清楚耶,阿b好好反省
语言模型so-vits
喜欢的歌手是本兮,可惜在我中学的时候离开了人间,再也听不到她唱的歌了,所以我用so-vits练了她的声音。
当听到翻唱的粤语歌的时候我觉得本兮又活了过来!悲~
用来训练的音源我处理的不太干净,所以练出来的也不是太好,尝试声调太高太低或者是古风歌都很容易跑调,后面应该听都听不出来是AI的声音来。
开始练本兮lora模型
第一次用kaggle练,每周有30个小时的GPU算力,嘎嘎嘎
希望能出图吧!至此,也算记录了一下我最近在干的事,害,纯在瞎折腾。一年就要过去了我好像什么也没有改变,看各种大佬凡尔赛,很多时候都是想得太多做的又太少。可我真的有在花时间去学习,有时候感到焦虑就总是觉得时间不够用,甚至吃饭都觉得是浪费时间。可有时候又摆烂到可以玩一天游戏,甚至不知道这样做有什么意义?我走在正确的路上了吗?