标签 AI 下的文章 - 🥝 E 家 分 享 🥝
首页
📋 留言板
🔗 友情链接
🛠️ E家百宝箱
❤️ 关于
推荐
🔍 VPS监控
🐉 青龙面板
💽 E家网盘
----------
🔗 CloudFlare
🔗 甲骨文云
🔗 RackNerd
搜 索
1
自动提取 ChromeGo 一键翻墙包内的免费节点
139 阅读
2
【汇总:免费节点 - 每周更新】
113 阅读
3
GigaFile - 日本免费大文件加密分享服务,最长保留文档100天
66 阅读
4
【E家分享月刊系列】2024-12
56 阅读
5
CloudFlare WARP 免费 VPN 搭建教程
55 阅读
精选网站
网站搭建
科学上网搭建
有感而发
软件技巧
Excel技巧
WordPress技巧
登录
搜 索
标签搜索
WordPress
脚本
GitHub
科学上网
哈佛管理导师
E家分享月刊系列
V2ray
Mac软件
AI
Cloudflare
Docker
免费节点
建站在线工具
Excel技巧
Notion
Nginx
ChatGPT
图像编辑
免费图床
网盘资源
E家之长
累计撰写
195
篇文章
累计收到
245
条评论
首页
栏目
精选网站
网站搭建
科学上网搭建
有感而发
软件技巧
Excel技巧
WordPress技巧
页面
📋 留言板
🔗 友情链接
🛠️ E家百宝箱
❤️ 关于
推荐
🔍 VPS监控
🐉 青龙面板
💽 E家网盘
----------
🔗 CloudFlare
🔗 甲骨文云
🔗 RackNerd
用户登录
登录
找到
8
篇与
AI
相关的结果
2023-12-25
自己部署谷歌 Gemini Pro Chat
前言最近谷歌的 Gemini Pro Chat 比较火,大有超过其他各大 GPT 的趋势。网上找到有人基于现有的 GPT 开源套壳修改而成的项目,为 Gemini Pro 聊天模型提供了一个直观、易用的用户界面。并且完全开源,支持自己以各种方式搭建。项目信息Github 项目地址:https://github.com/babaohuang/GeminiProChat体验网址:https://geminiprochat.com/项目介绍:与 Gemini Pro 聊天的最简 WebUI。部署API key 获取Google AI Studio 会为每个新的 API 密钥创建一个新的 Google Cloud 项目。您还可以在现有 Google Cloud 项目中创建 API 密钥。 注意:Gemini API 目前为公共预览版。尚不支持生产应用程序。 获取地址:https://makersuite.google.com/app/apikey点击“Create API key in new project"按钮。 复制生成的 API key。 使用 Vercel 部署(推荐)只需点击上面的按钮,并按照说明操作,即可部署自己的副本。[!NOTE]关于 API 使用过程中 “User location is not supported for the API use” 的解决方案如果你遇到了 “User location is not supported for the API use” 的问题,请按照以下步骤进行解决:前往 palm-proxy 仓库并点击其中的 “Deploy With Vercel”。部署完成后,你将收到 Vercel 分配的域名 (例如 https://xxx.vercel.app)。在你的 Gemini Pro Chat 项目中,设置名为 API_BASE_URL 的环境变量,其值为部署 palm-proxy 时获得的域名 (https://xxx.vercel.app)。重新部署你的 Gemini Pro Chat 项目来完成配置。这应该可以解决问题。感谢 antergone 提供解决方案。使用 Railway 部署只需点击上面的按钮,然后按照说明在 Railway 上进行部署。使用 Zeabur 部署只需点击上面的按钮,然后按照说明在 Zeabur 上进行部署。使用 Docker 部署要使用 Docker 进行部署,可以使用以下命令:docker run --name geminiprochat \ --restart always \ -p 3000:3000 \ -itd \ -e GEMINI_API_KEY=your_api_key_here \ babaohuang/geminiprochat:latest请确保将 your_api_key_here 替换为你自己的 Gemini API 密钥。这将启动 geminiprochat 服务,访问地址为 “http://localhost:3000”。环境变量你可以通过环境变量来控制网站。名称说明必填GEMINI_API_KEY你的 Gemini API 密钥。可以从此处 获取。✔API_BASE_URLGemini API 的自定义基本 URL。点击此处查看何时使用这个。❌HEAD_SCRIPTS在页面的“”之前注入分析或其他脚本❌PUBLIC_SECRET_KEY项目的密文字符串。用于为 API 调用生成签名❌SITE_PASSWORD为网站设置密码,支持用逗号分隔的多个密码。如果不设置,网站将允许公开访问❌本地运行前期环境Node: 检查你的开发环境和部署环境是否都在使用 Node v18 或更高版本。你可以使用 nvm 在本地管理多个 node 版本。node -vPNPM: 我们建议使用 pnpm 来管理依赖关系。如果从未安装过 pnpm,可以使用以下命令进行安装:npm i -g pnpmGEMINI\_API\_KEY: 在运行此应用程序之前,你需要从 Google 获取 API 密钥。你可以前往 https://makersuite.google.com/app/apikey,申请 API 密钥。部署安装依赖pnpm install复制 .env.example 文件并重命名为 .env,并在 .env 文件中添加 GEMINI_API_KEY。GEMINI_API_KEY=AIzaSy...运行应用程序,项目会在 http://localhost:3000/ 上运行。pnpm run dev其他类似项目基于 Gemini Pro API 搭建的网站,无需注册登录,可供国内免费使用。https://www.chatgemini.nethttps://gemini.ai4you.tophttps://googlegemini.co/try-google-gemini-for-free参考网站https://github.com/babaohuang/GeminiProChat/blob/main/README\_cn.mdhttps://andytreasurebox.blogspot.com/2023/12/gemini-api-key.html【END】
2023年12月25日
9 阅读
0 评论
0 点赞
2023-10-24
Midjourney 从零基础到落地实践
本文作者:yaoyao 转载地址:https://sspai.com/post/80640前言这是我的第一篇Midjourney教程。 从注册登录到基本的操作界面,提示词组成后缀介绍,到主流的生成图片的方式,以及最重要的提示词咒语分享,还有一些我的使用心得,希望对大家有帮助! 喜欢的话欢迎关注我,欢迎点赞收藏评论!~一、AI绘画的背景1.1 AI绘画的发展最近,AI绘画成为了热门话题,它的发展可以追溯到20世纪50年代的计算机绘画。当时人们开始尝试使用计算机生成艺术作品,但由于技术和算法的限制,计算机绘画的真实感仍然有限。随着机器学习和深度学习技术的不断发展,AI绘画得到了更大的发展空间。利用神经网络和机器学习技术,AI绘画可以模拟艺术家的创作思维和技巧,生成具有艺术感和真实感的作品。比如许多人对AI绘画产生了浓厚兴趣,是因为MidJourney生成的数字油画,获得了Colorado博览会艺术比赛的第一名。同时,AI绘画还可以帮助用户快速生成各种风格的艺术作品,为人们的创作提供更多可能性和灵活性。1.2 Midjourney 基本介绍Midjourney是一款AI绘画工具,只要输入关键字,就能通过AI算法生成相对应的图片,可以选择不同画家的艺术风格,例如安迪华荷、达芬奇、达利和毕加索等,还能识别特定镜头或摄影术语。由美国一家工作室开发的Midjourney于2022年3月首次亮相,在8月迭代至V3版本并开始引发一定的关注,而2023年更新的V5版本让Midjourney及其作品成功“出圈”。二、Midjourney新手前期准备接下来我们就重点介绍Midjourney这款AI工具。2.1 注册流程由于Midjourney是搭建在Discord平台上完成图片生成和交互操作的,所以,两者的关系类似于微信和小程序。因此,需要先注册一个Discord账号。Discord 官网链接:https://discord.comMidjourney 官网链接: https://www.midjourney.comDiscord / Midjourney 官网注册链接:https://discord.com/register两个渠道都可以,在Discord 官网或Midjourney 官网都可以注册。方式一:进入Midjourney 官网,在首页右下角点击“Join the Bate”,就进入了接下来的注册流程。方式二:首先打开Discord的注册链接,点击右上角“Login”点击登录,点击注册即可。按照流程提示,填写电子邮箱、用户名、密码等信息,点击注册后进行人机验证。2.2 下载客户端Discord 可以下载电脑桌面客户端和移动端,可以根据自己的使用习惯选择。官网链接: https://discord.com/download2.3 加入 Midjourney 社区登陆客户端后,点击左侧绿色指南针图标“探索公开服务器”,就可以看到Discord丰富多样的社区群组了。在Featured communities(特色社区)版块里,Midjourney排在第一个,接着我们点击进入Midjourney社区啦!2.4 新建属于自己的服务器创建服务器的窗口,首先选择“亲自创建”,然后选择“仅供我和朋友使用”,最后创建服务器名称,填写完成之后进入属于自己的服务器。2.5 添加 Midjourney 机器人创建好自己的服务器之后,将开始最重要的一步为自己对服务器添加Midjourney机器人。在频道中点击右边顶部的“成员”图标,点击“Midjourney Bot”,弹窗中点击“Add to Server”(添加到服务器)。选择刚才自己创建的服务器,这样就可以把最重要的机器人邀请到自己的服务器中了。在成员列表里,可以看到“Midjourney Bot”和自己。至此,所有的准备工作就完成啦!三、Midjourney生成第一张图经过以上繁琐的准备工作,马上带大家生成第一张属于自己的AI作品,一起来看看AI绘画的神奇吧。接下来会分为三步,输入关键词,调整图片,保存图片到本地。3.1 输入关键词Midjourney的交互方式为对话式,在对话框中输出“/”召唤出我们需要的指令,可以看到有数十几种指令。现在我们选择“/imagine”,对话框中会出现此“/imagine”以及黑色底的 prompt 英文单词,这种感觉好像要开始编程写代码了。没错,紧接着只需要在 prompt 后输入提示词,就可以生成相应的一幅画啦。接下来赶紧试一试吧,现在我输入提示词“a cat”,可以看到Midjourney bot显示“ a cat — v 5 @yaoyao (relaxe),过了五秒显示四宫格的喵咪图片。(– v 5的后缀会在第六部分后缀参数中详细介绍)3.2 高清图片和调整图片因为系统生成的是组合在一起的四宫格图。那么如何单独修改和查看一张图片呢?可以看到图片下方有 U1-U4、V1-4 两排按钮,它分别对应上面生成的图片。U 代表 Upscale(高档的):点击选择后 Midjourney 会单独放大对应的图片;V 代表 Variation(变化的):点击选择后 Midjourney 会根据所选择的图片再生成 4 张风格相似的图片。这时候我比较喜欢第四张喵咪的图片,我就可以点击U4,等待系统给我回复一张高清单独的第四张猫咪图。接下来点击V4进行调整,同样经过几秒给我回复了微调的四张图。3.3 保存图片接下里就是把图片保存到本地啦。想要保存高清大图,一定要点击图片,再点击图片下方的“在浏览器中打开”,这样就可以在浏览器中查看到高清大图,右键可保存图片。四、Midjourney基本操作指令介绍4.1 Midjourney 基本操作指令一览表/imagine 【prompt】最基本的文生图绘画指令,在后面输入提示词就可以生成图片。/describe 【image】最新的图生文指令,上传图片,图片生成四段描述词/settings 进行模式设定,包括模型版本、样式值、质量值和升级器版本等。/subscribe 购买会员服务的链接,管理订阅/ask 【question】获取问题答案/blend 混合模式,该指令允许你上传2-5张图片,然后将这些图片合成新的图片效果。/info 查看你的用户信息,有关当前排队或正在运行的作业、订阅类型、续订日期等信息。/help 指南及基本的帮助信息/prefer option set 创建或管理一个自定义选项/prefer option list 查看你当前的自定义选项/prefer suffix 指定一个后缀,添加到每个提示的末尾/show 重现自己的画作/fast 切换到快速模式/relax 切换到放松模式,比 Fast 慢,一般付费用完 Fast 之后会自动切换到 Relax;/private 私人创作,作品不会放在公开空间。/stealth 切换到隐身模式(对于专业计划的用户 60 美金/月),生成的图片不在社区展示/piblic 切换到公共模式(对于专业计划的用户 60 美金/月)4.2 Midjourney主要操作指令介绍/imagine 文生图绘画指令/describe 最新的图生文指令点击上传图片,然后 MidJourney 会自动分析图片的内容,生成 4 条适合的 Prompt,可以在这些 Prompt 的基础上添加自己的创意想法,创造出更有趣的设计。这个功能是4月初上线的,简直好评如潮,不用花费太多时间去构思 Prompts,一键生成满意的图片。/blend 图像混合模式/settings 进行模式设定第一行:版本号 MJ version 1, 2, 3, 4, 5 是生成图片版本,最新的是v5,分辨率更高,理解力更强,细节处理更好,强烈推荐;第二行:画风 Niji Mode是二次元风格,MJ Test是漫画风格,MJ Test Photo是照片风格,最近Niji风格也是大火;第三行:图片的质量参数 质量越高,图片效果越好,默认的是Base quality, 质量越好,消耗的资源越大;第四行:风格参数,low, med, high, very high四种模式,越高图片越精细第五行:操作模式:Public mode是公开模式,所有人都可以看到你生成的Stealth mode是隐私模式,只有自己可以看到Remix mode是混音模式,可以局部风格进行调整Fast mode是快速模式,即可以快速出图Relax mode是放松模式,出图较慢settings 操作模式详细介绍在公共模式和隐身模式之间切换。对应于/public 和/stealth 命令。切换到Remix混音模式.(1)在文本框内输入 /prefer remix,按回车键发送以启用 Remix 模式,或使用/settings 命令并切换按钮激活混音模式 Remix Mode。启用后,生成的所有图像都会变成 Remix 模式,再次发送 /prefer remix 可以关闭该模式。(2)点击已经生成好的图像下方的 V1/ V2/ V3/ V4 任一按钮,在弹出的文本框内修改原来的提示词,然后提交。通过不修改弹出窗口中的提示,在 Remix 处于活动状态时创建标准图像变体。正常模式下 V 按钮是用来生成图像变体的,点击后会变成蓝色;开启 Remix 模式后,点击 V 按钮会弹出可以修改原有提示词的窗口,按钮会变成绿色(3)可以在使用 Remix 时切换模型版本。完成 Remix 后,使用/settings 或/prefer remix 命令将其关闭。/help 指南及基本的帮助信息help里面有很多使用说明,对于新手来说,是很好的引导提示。/prefer suffix 指定一个后缀,添加到每个提示的末尾设置默认添加到每个提示末尾的后缀,设置后每次会自动在提示内容后面加上后缀。比如添加“–hd”如果需要去除之前设置的后缀,只需要再次输入,将“value”字段内容为空保存就可以清空之前的后缀设置。注意后缀只支持参数,不支持提示词。五、Midjourney图片生成方式5.1 关于咒语 Prompt(1)Prompt 咒语在作图之前,我们先来了解一下Prompt。如果把Midjourney比喻成魔法世界,那么Prompt就是魔法咒语。简单来说Prompt是Midjourney Bot 解释以生成图像的文字描述。 Midjourney Bot 将 Prompt 中的单词和短语分解成为Token的较小部分,然后用于生成图像。所以提示词越详细、纬度越多的话魔法更强,就可以得到更加有魔力的图片。(2)咒语的结构组成初级咒语:一个基本的提示可以简单到一个单词、短语或表情符号。高级咒语:可以包括一个或多个图像链接、多个文本短语或单词,以及一个或多个后缀参数。接下来这部分主要讲解 Text Prompt 咒语部分,Parameters 后缀参数可以跳转到本文的第六部分详细讲解。(3)咒语的维度主体:人、动物、人物、地点、物体等。person, animal, character, location, object,媒介:照片、绘画、插图、雕塑、涂鸦、挂毯等。photo, painting, illustration, sculpture, doodle, tapestry环境:室内、室外、月球上、纳尼亚、水下、翡翠城等。indoors, outdoors, on the moon, in Narnia, underwater, the Emerald City构图:顶视、人像、爆头、特写、鸟瞰图等。Top view,Portrait, headshot, closeup, birds-eye view,灯光:柔光、环境、阴天、霓虹灯、工作室灯等。soft light, ambient, overcast, neon, studio lights氛围:充满活力、柔和、明亮、单色、彩色、黑白、柔和等。vibrant, muted, bright, monochromatic, colorful, black and white, pastel情绪:稳重、平静、喧闹、精力充沛等。Sedate, calm, raucous, energetic风格:东方山水画、浮世绘、日本漫画风格、皮克斯、蒸汽朋克、新海诚、宫崎骏风格。Tradition Chinese Ink Painting,Japanese Ukiyo-e,Japanese comics/manga,Pixar,Steampunk,Makoto Shinkai,Miyazaki Hayao style等等等(4)使用咒语的例子中秋主题插画:主体:rabbit, Chang’e(嫦娥,兔子)媒介:ethereal illustrations(插画)环境:moon palace(月宫)氛围:Chinese traditional festival Mid-Autumn Festival(中国传统节日中秋节)情绪:charming(迷人的)风格:oriental style(东方风格)完整关键词咒语:Chinese traditional festival Mid-Autumn Festival, Chang’e, rabbit, moon palace, oriental style, ethereal illustrations, white and red, orange and sea blue, charming palaces, ancient Chinese costumes, folklore, festival atmosphere, historical images接下来根据「 中秋主题插画 」为项目背景,分别运用midjourney三种主要生成图片的方式去讲解。分别是文生图、图生图、图生文生图。5.2 文生图第一步:召唤指令在对话框中输出“/”召唤出“/imagine”,前面第三部分生成第一张图片我们已经介绍过了。第二步:输入关键词把上面的关键词咒语复制回车即可。5.3 图生图 三步第一步:上传图片点击输入框 “+” 加号,上传选中的图片,按回车。第二步,复制图片地址查看图片,在浏览器中打开,复制图片地址。第三步:输入图片地址和提示词在输入框中选中/imagine ,粘贴图片地址,接着按空格(重点),复制提示词,按回车即可。关键词:Chinese traditional festival Mid-Autumn Festival, Chang’e, rabbit, moon palace, oriental style, ethereal illustrations, white and red, orange and sea blue, charming palaces, ancient Chinese costumes, folklore, festival atmosphere, historical images这一步我们还是用跟上面一样的提示词,对比看看得到的图片。5.4 图生文生图(四步 最新超好用)第一步,上传图片在输入框中选中/describe ,上传准备好的图片。第二步,选择提示词等待几秒就可以看到神奇的魔法生成的四条描述词。选择一条或者组合一下准备好。这边我选择了第一条:a chinese scene with a full moon, in the style of playful illustrative style, detailed, layered compositions, colorful storytelling, light cyan and gold, architectural illustrator, magical creatures, thomas cole –ar 75:46第三步,复制图片地址查看图片,在浏览器中打开,复制图片地址。第四步:输入图片地址和提示词在输入框中选中/imagine 输入图片地址,之后空格(注意一定要记得空格),接着输入选择的第一条咒语。最后得到的图片与参考图风格极度相似,一定会让你满意啦。总结:横向对比三种效果文生图,图生图,图生文生图六、Midjourney基本后缀参数介绍6.1 Midjourney基本后缀一览表1、宽长比:–aspect,或–ar调整图片的宽长比。2、混乱:–chaos 改变结果的多样性。较高的值会产生更多不寻常和意外的效果。3、负面提示:–no,–no plants表示会尝试从图像中移除植物。4、质量:–quality <.25, .5, 1, or 2>,或–q <.25, .5, 1, or 2>您要花费多少渲染质量时间。默认值为 1。值越高成本越高,值越低成本越低。5、种子:–seed Midjourney 机器人使用种子编号创建视觉噪声场,如电视静态,作为生成初始图像网格的起点。种子编号是为每个图像随机生成的,但可以使用 –seed 或 –sameseed 参数指定。使用相同的种子编号和提示将产生相似的结束图像。6、停止:–stop 使用–stop参数在流程中途完成作业。以较早的百分比停止作业会产生更模糊、更不详细的结果。7、风格:–style <4a, 4b or 4c>在 Midjourney模型版本4的版本之间切换8、程式化:–stylize ,或–s 参数会影响 Midjourney 的默认美学风格应用于作业的强度。8、升频器:uplight 选择 U 按钮时使用替代的“轻型”升频器。结果更接近原始网格图像。放大后的图像细节更少,更平滑。upbeta 选择 U 按钮时使用替代的 beta 升频器。结果更接近原始网格图像。放大后的图像添加的细节明显更少。6.2 Midjourney重点后缀介绍(1)版本 Version –v目前Midjourney已经更新到V5版本,V1、V2、V3、V4、V5每个版本的风格都不同,版本号越高,图片的分辨率越高,效果也最佳,提示词内没有版本参数时默认以V5 生成。后缀描述:–version 5 可以缩写为 –v 5–version 接受值 1、2、3、4 和 5。下面为V5 和V4 的出图效果对比。Midjourney V1 – V3 您可以使用–version 或–v 参数或使用/settings 命令并选择模型版本来访问更早的 midjourney 模型。不同的模型擅长处理不同类型的图像。Midjourney V4 模型具包括 a/b/c 三种不同的风格,通过在–V 4 提示末尾添加–style 4a 或者–style 4b 来试验这些版本。style 4c 是当前默认值,不需要添加到提示末尾。style 4a 、–style 4b:仅支持 1:1、2:3 和 3:2 纵横比style 4c(默认值):支持高达 1:2 或 2:1 的纵横比例如:/imagine prompt vibrant California poppies –style 4a(2)模型NijiNiji Model 该模型是 Midjourney 和 Spellbrush—niji 之间的合作,专门针对动漫盒二次元的模型插图风格。该模型对动漫、动漫风格和动漫美学有更多的了解。它在动态和动作镜头以及以角色为中心的构图方面表现出色。一般这个模型用在动画插画上,如果你需要画一幅插画,那么用 niji 模式比 V 系列模型效果更好。后缀描述:–Niji例如:/imagine prompt vibrant California poppies –niji(3)纵横比 Aspect Ratios –ar后缀描述:–aspect <值>: <值> 可以缩写为 –ar <值>: <值>–aspect 参数–ar 更改生成图像的纵横比。宽高比是图像的宽高比。它通常表示为用冒号分隔的两个数字,例如 7:4 或 4:3。不同的 Midjourney 版本模型具有不同的最大纵横比。–ar 参数将接受从 1:1(正方形)到每个模型的最大纵横比的任何纵横比。但是,在图像生成或放大过程中,最终输出可能会略有修改。示例:提示使用–ar 16:9(1.78) 创建具有 7:4(1.75) 纵横比的图像。大于 2:1 的宽高比是实验性的,可能会产生不可预测的结果。常见的纵横比:aspect 1:1 默认纵横比。aspect 5:4 常见的框架和打印比例。aspect 3:2 印刷摄影中常见。aspect 7:4 靠近高清电视屏幕和智能手机屏幕。例如:/imagine prompt vibrant california poppies –ar 5:4(4)混乱度 Chaos –cchaos 影响出图结果的变化程度:chaos 意为混乱,在 MJ 中使用 chaos 参数可以影响生成结果的变化程度。在提示词后添加 –chaos 或 –c 启用该功能,其数值选范围为 0-100,默认值为 0。chaos 数值越低,生成的结果在风格、构图上较相似;数值越高,风格、构图的差异会越大,会有让人意象不到的结果。chaos 的生成的效果:后缀描述:–chaos <值> 可以缩写为 –c <值>范围:0-100,默认值为0例如:/imagine prompt watermelon owl hybrid –c 50低值–chaos使用较低的 –chaos 值或不指定值将生成每次运行作业时略有不同的初始图像网格。高值–chaos–chaos 每次运行作业时,使用较高的值将产生更多变化和意外的初始图像网格。非常高的值–chaos–chaos 每次运行作业时,使用极高的值将产生不同的初始图像网格,并且具有意想不到的构图或艺术媒介。(5)图片质量 Quality –q参数更改生成图像所花费的时间。更高质量的设置需要更长的时间来处理并产生更多的细节。更高的值还意味着每个作业使用更多的 GPU 分钟数。质量设置不影响分辨率。后缀描述:–quality <值> 可以缩写为 –q <值>数值:.25、.5 、 1,默认值为1默认 –quality 值为 1。半质量 = –q .5,基本质量 = –q 1,高质量 = –q 2。较高的值会使用更多订阅的 GPU 分钟。quality 接受数值:默认值 .25、.5 和 1。quality 仅影响初始图像生成。quality 适用于模型版本 1、2、3、4、5 和 niji。更高的 –quality 设置并不总是更好。有时较低的 –quality 设置可以产生更好的结果——这取决于您尝试创建的图像。较低的 –quality 设置可能最适合抽象外观。较高的 –quality 值可以改善受益于许多细节的建筑图像的外观。选择与您希望创建的图像类型最匹配的设置。例如:/imagine prompt woodcut birch forest –q .5(6)种子值 Seeds –seedMidjourney使用种子编号创建视觉噪声场(扩散模型的起始图片),作为生成初始图片网格的起点。种子数是为每个图片随机生成的,但可以使用–seed或 –sameseed参数指定。使用相同的种子编号和提示产生相似的最终图片,利用这点我们可以生成连贯一致的人物形象或者场景。后缀描述:–seed <值> 还可以为 –sameseed <值>数值范围: 0–4294967295例如:/imagine prompt celadon owl pitcher –seed 123(7)风格化参数Stylize — s风格化参数可以让 Midjourney生成更具有艺术色彩、构图和形式的图像。风格低 = –s 50,风格中 = –s 100,风格高 = –s 250,风格非常高 = –s 750,后缀描述: –stylize <值> 可以简写为 –s <值>数值范围:0-1000,默认数值100风格化数值较低时,生成的图像与提示词匹配较高,但艺术性较差。反正,风格化数值较高时,生成的图像非常具有艺术性,但与提示词的联系较少。不同的数值生成的图片在细节上有较大的区别,大家根据图片效果可以选择合适的数值。不同的 Midjourney 版本模型具有不同的风格化范围,只能在范围内输入数值。V4 模型例如:/imagine prompt illustrated figs –s 100V5 模型例如:/imagine prompt colorful risograph of a fig –s 100七、Midjourney实战案例上文介绍Midjourney从注册到基本参数,以及手把手图生图的例子,相信大家已经对Midjourney有了基本的了解啦。作为设计师的我们,必须要抓紧时间,跟上趋势,提高自己的职场竞争力。接下来讲解Midjourney辅助设计进行项目落地的案例。7.1 轻松四步 制作玻璃炫彩3D图标风格定义:需要设计炫彩的3D图标用于弹窗,根据主题来设定风格。我的需求风格关键词为赛博朋克,玻璃熔体。构思创意:在构思创意阶段,虽然我们现在可以利用Midjourney辅助我们进行设计,但终究还是考验作为设计师的审美创意和基本功,所以我们要确定好图标主体、配色、形状、背景等细节。写描述词:图标的描述词,主要分为五个部分,分别为:图标描述、背景描述、质感描述、风格描述、画质描述。查找关键词库,再把需要的描述词放在编辑器里面,经过多次调整生成的图标关键词为:hourglass<可置换>,icon design, minimalistic, glowing, clean shadows, Gradient translucent glass molten body, white background, Clear glass, Cyberdelic, Holographic, high detail, c4d, 4K图标描述:钥匙,图标设计背景描述:白色背景,发光,质感描述:渐变半透明玻璃熔体,风格描述:赛博朋克,全息,画质描述:c4d,4K在调整出确定的风格后,通过置换第一个关键词,制作图标,就可以保持统一的图标风格了。风格探索:尝试不同的风格,用指南针举例子。可以尝试替换里面的风格关键词。关键词如下:Compass, icon design, minimalism, clean shadows, white background, abstract line character styling, high detail, 4K7.2 图标关键词分享可爱的豪华城堡,粘土材料,迪士尼,盲盒风格关键词:a 3d rendering of a slice cute Luxury Castle,UI, Icon, Clay material, Disney, Blind box style, Super meticulous, Lovely, Soft, A clean background, Solid background color, 3D, C4D, HD, 8k,APP Live Gift –niji 5有翅膀的礼盒,粘土材料,迪士尼,盲盒风格关键词:A gift box icon with wings on the back, UI, Icon, Clay material, Disney, Blind box style, Super meticulous, Lovely, Soft, A clean background, Solid background color, 3D, C4D, HD, 8k –niji 5 –飞机,超现实,任天堂,概念设计关键词:A plane,To embark on a journey in the sky,in the style of playful character design, nintencore, light green and orange, ruan jia, ad posters, hyper-realistic details, free-associative –s 750 –q 2 –v 5 –黄色王冠,游戏设计关键词:golden crown on a white background, in the style of 2d game art, personal iconography, light magenta and orange, fairy academia, award winning, angura kei, crisp and clean look –ar 4:3 –v 5 –火箭,3Drocket,UI, Icon, Clay material, Disney, Blind box style, Super meticulous, Lovely, Soft, A clean background, Solid background color, 3D, C4D, HD, 8k,APP Live Gift –v 5 –两只猫咪,迷幻,neon poptwo kitty cats are standing and holding weapons, in the style of psychedelic portraiture, mote kei, commission for, queencore, angura kei, neon pop, devilcore –ar 3:4 –q 2 –niji 5深海蘑菇,电影风格,John howeA beautiful painting,As far as eye can see,At the bottom of the sea,Mushrooms,Moon,Evening,Clearing,Rendered in cinema4d,John howe,Thomas kinkade兔子,中国功夫,octane renderingLovely anthropomorphic rabbit, dressed in hanfu, posing in Chinese kungfu, beautiful garden full of flowers, ultra clear details, ultra clear materials, close-up, complex textures, octane rendering, ZBrush, Substance Painter. Artstation Super High Quality, –v 5奔跑的女孩,森林里,Octane RenderingA very cute girl in a red flight jacket and bucket hat, full body, running in the forest at night, mystery adventure, flowers, plants, fireflies, intricate details, popmart blind box, clay material, pixar trends, 3d art, c4d , Octane Rendering, Animated Lighting, Uplighting –v 5八、Midjourney常见问题8.1 Midjourney基本问题Q1:Midjourney需要安装吗?Midiourney不是一个需要安装的软件,它是一个建立在Discord之下的工具。用户只需要在Discord中输入文字即可使用它生成图片。Q2:Discord是什么?Discord是一款免费社交软件,专门为社区设计。它类似于LINE,但功能更强大,具备机器人和各种程序功能,用户可以在上面开发自己的工具,该软件有网页版和手机版App。Q3:Midjourney对电脑配置有要求吗?与电脑本身的性能无关,因为真正运算图片的是云端电脑。即使在运算过程中关闭Midiourney也会继续生成图片。Q4:生成图片是免费的吗?新用户可以享有25次免费使用额度,超过这个限制就需要开通会员(现在为了限制用户薅羊毛,已经取消了)10美金会员核心介绍:一个月可以制作200张图,3个并发处理。30美金会员核心介绍:无限制作图,15小时快速出图模式。3个并发处理。60美金会员核心介绍:无限制作图,30小时快速出图模式。12个并发处理。Q5:如何开通会员?可以在Midiourney频道中输入/subscribe 命令来开通会员。目前仅支持使用VISA信用卡付款。如果没有这种信用卡,可以在某宝或者找相关人士进行处理。Q6:fast模式和relax模式有何不同?在输入框输入/fast或者/relax即可切换模式,默认是fast模式。fast模式:无需排队,发送prompt立马绘图。(30美金会员,支持15小时Fast模式)。relax模式:需要排队,排队完成自动生成。Q7:Midjourney 和 Stable Diffusion 有何不同?Midjourney 需要在线上使用,可以快速上手,只需要输入提示词,不需要花费太多的精力,既可生成艺术感十足的图片。Stable Diffusion 需要安装和部署在本地,可以使用模型来生成类似质量的图像,对于同类风格游戏漫画IP形象来说更有落地价值。Q8:生成的图片版权归谁?官方表示,会员生成的图片版权归创作者所有,这意味着会员可以自由使用他们的作品。Q9:描述词在哪里找参考?我整理了很多Prompts关键词,可以关注我,公众姚十八设计 回复「AIGC关键词」 领取。让你快速上手AI绘画。Q10:如何查看自己生成过的历史作品?Midjourney网站,登入自己账号,进入自己的主页。在这里可以找到图片的描述、位置以及下载。主页图片只呈现U过输出的图片,不呈现过程图,且不可删除Q11:Fast模式和Relax模式有什么差别?在输入框输入/fast或者/relax即可切换模式,默认是fast模式fast模式:无需排队,发送prompt立马绘图。(30美金会员,支持15小时Fast模式)relax模式:需要排队,排队完成自动生成。8.2 使用MidJourney使用需要哪些能力?英语基础:由于Midjourney是英文AI绘画软件,需要拥有简单的英语基础,能看懂基本的英语指令,输入英语关键词,当然小白也可以轻松操作。创意想法:创作的基础还是需要创意和想法,一切都是工具,帮助我们提高创作的效率。艺术鉴赏:了解基本的艺术风格和艺术流派,艺术大师的作品,对于AI绘画至关重要。比如超现实主义、波普艺术、立体主义、达达主义、未来主义、现实主义、极简主义、抽象派、新艺术、超现实主义、表现主义、构成主义等各种艺术风格流派。知识管理:关键词决定了输出图片的质量。因为关键词的种类繁多,其中不乏大量的摄影、绘画等细分领域的专业术语,我们的大脑难以完全记住如此庞大的关键词库,所以需要构建知识库,掌握知识管理能力。修图能力:通过midjourey绘画的基础上,能够熟练运用PS,进行二次创作,完善设计作品。九、Midjourney高质量输出9.1 提示词工具在Midjourney的世界里,提示词就是沟通的媒介,重要性不言而喻,接下来,推荐一些好用的提示词工具。(1)OPS官网:https://moonvy.com/apps/ops/Midjourney提示词可视化并提供编辑功能的工具,方便好用提高效率。显示英文提示词的中文翻译为提示词进行分类:普通、样式、质量、命令随意拖动删除隐藏提示词丰富的常用提示词词典可以导入自己的 Notion 提示词词典(2)MidJourney 提示助手可以查看探索样式和复杂的 MidJourney 提示。官网:https://prompt.noonshot.com/(3)AI DawnmarkAI绘画词汇生成,包含中英文,涵盖Novel、Nijijourney、Midjourney、Dreamstudio、Stable Diffusion使用场景官网:https://ai.dawnmark.cn/9.2 提示词大全整体的关键词条我们大致的分为:主体、媒介、环境、构图、灯光、氛围、风格、材质、后缀等做输入来控制我们的画面结果。根据这个分类我汇总了一批关键词,关注公众「姚十八设计」 回复「AIGC关键词」 领取。结语随着AI人工智能的发展,设计师利用AI绘画来开脑洞并辅助出图是趋势所向。许多设计师担心自己的工作会被取代,事实上,设计本身是理性而浪漫的工作,仅靠随机性做设计是完全不可取的。实际上AI绘画工具,只是我们的助手,可以帮助我们更快速地完成设计工作,例如设计引导页插画、H5活动图、3D礼物图标以及帮助我们做用户调研等。作为设计师,我们需要定义规则与框架,从AI输出的结果中寻找最匹配的,以便更快更好地达成设计目标。同时,我们应该保持终生学习的心态,接受智能工具的挑战,才能在竞争中脱颖而出。【END】
2023年10月24日
7 阅读
0 评论
0 点赞
2023-07-12
Midjourney 零基础设计角色一致性
本文作者:yaoyao 转载地址:https://sspai.com/post/80999前言Midjourney 作为目前一款最火的 AIGC 绘图软件,在生成图片时,让人很惊艳,但是由于随机性很强,对于生成角色人物时,就面临一个很大的难题:如何保持角色输出的一致性呢?今天这篇文章,就带大家从基础的角色类型六大方向聊起,到摄影的构图光影,再到稳定角色的五大方法,绝对干货满满。一、角色类型六大方向1. Midjourney 角色万能公式Midjourney 是一种 AI 扩散模型,它通过我们输入的书面提示词,从噪音中创建图像。Midjourney 在创作人物角色万能公式:「角色描述」+「视角」+「距离」+「情绪」+「服装」+「风格」+「光源」2. 角色类型六大方向可以看到上面的万能公式中,包括角色构图的视角、距离、光源、角色情绪、角色服饰、风格,这也就是接下来我们要聊的角色类型的六大方向。其中三个方向是摄影方面的基础知识,后三个方向是角色情绪氛围感的营造。1)角色构图的视角人物构图的视角可以根据拍摄角度的高低和拍摄距离的远近来分类。在我自己整理的「AIGC关键词」库中选取几个有代表性的构图视角,来看一下 Midjounrney 的效果吧。① 正视角正视角是指在人像构图时,拍摄对象正对着相机的姿态,使人像呈现出正面的视角。咒语关键词:Front view② 后视角从人物背后拍摄,突出人物的背影和轮廓,通常用于创造出一种神秘、不可知或者留有想象空间的感觉。咒语关键词:Back View③ 侧视角侧面视角将人物的侧脸或侧身呈现出来,突出人物的轮廓和线条。这种视角常用于突出人物的特征、情绪或者用于展现人物的神秘感。咒语关键词:Side view④ 俯视视角从较高的位置向下拍摄人物。这种视角可以使人物显得较为渺小或弱小,适用于表现人物的脆弱性、无助感或者用于突出人物在环境中的位置。咒语关键词:High Angle⑤ 仰视视角从较低的位置向上拍摄人物。这种视角可以使人物显得更加强大、威严或者突出人物的自信和权威感。咒语关键词:Low Angle2)角色镜头的距离① 全景人物将整个人物的身体完整地包括在画面中。这种距离适用于需要展示人物的整体形象和服装风格的情况,例如时尚摄影或人物在特定环境中的定位。咒语关键词:Full-length Shot② 半身人物将人物的腰部或大腿以上的部分包括在画面中。这种距离通常用于展示人物的上半身,突出人物的表情、动作和姿势。咒语关键词:Half-length Shot③ 大头照将人物的头部和肩部包括在画面中。这种距离主要关注人物的面部特征、表情和眼神,常用于肖像摄影和艺术照。咒语关键词:Headshot④ 特写人物将人物的面部或某个局部特写出来,如脸部、眼睛、嘴唇等。这种距离能够突出人物的细节和情感,强调人物的表情和眼神。咒语关键词:Close-up Shot⑤ 细节特写将人物的局部细节或特定对象特写出来,如手部、鞋子、首饰等。这种距离可以突出细节和个性,用于强调人物的个人风格和特征。咒语关键词:Detail Shot3)角色光源的氛围感摄影中的光源对于人物摄影起着至关重要的作用,它可以影响照片的氛围、表达情感以及突出人物的特征。在选择光源时,要考虑到拍摄环境、主题和所需的效果。每种光源都有其独特的特点和应用场景,灵活运用不同的光源可以为人物摄影带来丰富的表现力和创意。在 Midjourney 中,一般不写灯光的描述,出图的质感也是很棒的,所以灯光的参数很容易被忽略。在我自己整理的「AIGC关键词」库中选取几个有代表性的灯光参数,来观察一下对角色氛围感的影响。① 暖光源暖光源通常呈现出较低的色温,呈现橙色或黄色调。它可以营造出温暖、舒适的氛围,增加照片的情感和温馨感。暖光源适合用于人物肖像、情感表达和温暖场景的拍摄。咒语关键词:Warm Light② 柔光源柔光源是一种能够产生柔和、均匀光线的灯光工具。它可以通过柔光箱、反射板或扩散器来实现,使光线更加柔和,减少阴影的硬度。柔光源适合用于人物肖像摄影,可以产生柔滑的肌肤效果和平滑的过渡。咒语关键词:Soft Light③ 冷光源冷光源的颜色温度较高,通常呈现出蓝色或白色调。它可以营造冷静、现代的氛围,适合用于时尚、商业等类型的人物摄影。咒语关键词:Cool Light④ 霓虹光源霓虹灯是一种具有鲜艳亮丽色彩的光源,常用于城市夜景或时尚摄影中。霓虹光源在人物摄影中可以产生独特的视觉效果和氛围,为照片增添了艺术感和时尚感。在 Midjourney 中使用较为广泛,让画面效果更加具有视觉冲击力。咒语关键词:Neon Lights⑤ 伦勃朗光伦勃朗光是一种经典的照明技术,以17世纪荷兰画家伦勃朗的绘画作品而得名。这种照明技术在人物摄影中可以产生独特的效果,突出人物的面部轮廓和表情。咒语关键词:Rembrandt light4)角色的情绪表情是拍摄人物时非常重要的一部分,它能够传达情感、故事和与观众的连接。① 微笑微笑是最常见和受欢迎的表情之一。它能够给人一种友善、亲切和开朗的感觉。咒语关键词:Smile② 内敛内敛的表情可以传达出思考、沉思、冷静或者严肃的感觉。这种表情适合用于突出人物的深度、内在世界或者专注于某个任务的情境。咒语关键词:Serious Expression③ 悲伤哀伤和忧郁的表情能够传达出悲伤、忧伤或者沉重的情感。这种表情适用于拍摄艺术作品、文化题材或者探索情感的摄影作品。咒语关键词:Sad④ 神秘神秘和迷惑的表情可以激发观众的好奇心和探索欲望。这种表情适合用于艺术摄影、时尚摄影或者表达复杂情感的作品。咒语关键词:Mysterious⑤ 哭泣咒语关键词:Cry5)角色的服装服装也是一个很专业的领域,需要学习很多服装相关的知识。① 传统风格传统风格的服饰通常是基于特定地区、文化或历史时期的传统服饰。它们可以是古代民族服饰、民俗服装或宗教仪式上的服饰,反映着传统价值观和身份认同。咒语关键词:Chinese Traditional style② 时尚风格时尚风格的服饰追随当前的时尚潮流和流行趋势。它们可能来自于时尚设计师的最新系列,注重时尚、前卫和个性化,常常以创新的方式演绎经典元素。咒语关键词:Fashionable style③ 正装风格正装风格的服饰适用于正式场合和商业环境,例如西装、套装和礼服。它们通常注重修身剪裁、优雅简约和专业形象。咒语关键词:Formal style④ 朋克风格朋克风格的服饰具有叛逆、个性和反主流的特点。它们可能包括皮革、铆钉、鱼网袜、涂鸦等元素,表达个人独立和反叛的态度。咒语关键词:Punk style⑤ 街头风格街头风格的服饰受到年轻人、街头文化和街头艺术的影响。它们常常包括休闲、运动和街舞风格的服装,注重舒适性和自由感。咒语关键词:Street style6)角色的风格Midjourney 可以模仿不同的绘画风格,并生成与该风格相似的绘画作品。这个时候,我们需要懂得基本的艺术家的风格和流派,提高创造性和审美决策来产生真正独特的 AI 艺术作品。下面分享一些 Midjourney 上很火的风格:① 写实人物写实人物风格在绘画中的作用是追求对人物形象的高度还原和真实性,创造出具有强烈共鸣力和艺术感的作品。咒语关键词:90s Hong Kong-style street② 日本漫画风日本漫画风格在绘画中具有独特的表现方式和艺术特点。它能够塑造出个性鲜明的角色形象,表达丰富的情感和情节,营造活泼有趣的画面,并推动创意和想象力的发挥。咒语关键词:Japanese comics③ 泡泡玛特泡泡玛特风格是成立于2010年的潮流文化娱乐品牌。盲盒风格在 Midjourney 中特别火热。咒语关键词:Popmart blind box④ 中国风中国风绘画注重表现自然景观和人文情怀。它常常通过描绘山水、花鸟、人物、建筑等元素,传达出对自然环境和人类生活的热爱与赞美,以及对和谐共生的追求。咒语关键词:Tradition Chinese Ink Painting style⑤ 赛博朋克赛博朋克绘画强调科技和未来感的表现。它常常描绘高科技设备、虚拟现实、机械增强等元素,营造出充满科幻和未来主义氛围的画面。咒语关键词:Cyberpunk3. 结语生成一张角色图片需要输入简洁精准的文字描述,这里总结复习一下 Midjourney 在创作人物角色万能公式:「角色描述」+「视角」+「距离」+「情绪」+「服装」+「风格」+「光源」你也可以只选取部分描述词,也会得到满意的图片,在输出图片时,不单单是一个段描述词就可以得到想要的效果,需要不断调整修改描述词,逐步完成效果。二、控制角色一致性五种方法接下来具体介绍五种利用 MIdjourney 输出统一性角色的方法,方法有简到繁,涉及到一些操作、后缀参数、prompt,适合有一定基础的同学查看。新手也可以点击我的主页查看我上一篇零基础的文章《Midjourney从零基础到落地实践》,速度学习一下再看下文会更加友好哦。Midjourney 是一种 AI 扩散模型,从噪音中创建图像。随机性比较强,即使输入相同的命令,每次输出的结果都会不同。我们可以通过垫图、控制提示词的方式调整它输出较为稳定的角色。如果要求训练模型并将其用于特定需求,Stable Diffusion 创建一致的角色要更加专业简单。1. 垫图法1)第一步:关键词生成角色在 Midjourney 中输出关键词,创建一个自己喜欢的角色,选择自己喜欢的图片,选择U3 。描述词:Blind box style, Cute little girl with rabbit ears hat, Full body, Look at the camera, Pop mart, octane rendering, ultra details, edgelighting, chibi, The best quality, HD, C4D, chiaroscuro, 8K2)第二步:复制图片链接选择自己喜欢的图片,点击U3 放大图像,右键获取网址(URL)复制链接。3)第三步:记住万能公式:图片URL+关键词+iw 2在命令框中输入「/imagine」在描述词前面加上URL,在结尾加上– iw2 。描述词:图片链接 Blind box style, Cute little girl with rabbit ears hat, Full body, Look at the camera, Pop mart, octane rendering, ultra details, edgelighting, chibi, The best quality, HD, C4D, chiaroscuro, 8K –iw 24)第四步:效果对比大家可以对比一下原图与本次生成的图像,我们可以看出该方法生出角色的一致性很高,风格和整体氛围基本一致。2. Seed值法这个方法可以利用一张图片,生成一系列图片。1)第一步:关键词生成角色这一步与前一个方法一样,在 Midjourney 中输出关键词,创建一个自己喜欢的角色,选择U3作为垫图生成相似的角色,复制URL 。描述词:Blind box style, Cute little girl with rabbit ears hat, Full body, Look at the camera, Pop mart, octane rendering, ultra details, edgelighting, chibi, The best quality, HD, C4D, chiaroscuro, 8K2)第二步:找到图片seed值在生成的四宫格界面右上角,点击表情图标。在搜索框中输入:envelope,找到信封图标,点击它。3)第三步:复制seed值这时候你就会收到 Midjourney Bot 的消息,在私信中,打开消息你就会获得 seed 值,复制图片的 seed 值。4)第四步:记住万能公式:替换关键词+seed值修改你的关键词把「ears hat」改成「 ears hat 」,并且在最后加上 –seed 1668584462 。描述词:Blind box style, Cute little girl with cat ears hat, Full body, Look at the camera, Pop mart, octane rendering, ultra details, edgelighting, chibi, The best quality, HD, C4D, chiaroscuro, 8K –seed 16685844625)第五步:效果对比可以看到效果还是很好的,快来试一试吧。当然这也是初级方法,接下来还会分享一些高级技巧。3. Panels动作法这个方法可以帮助创建连续的动作。1)生成不同的动作:N panels with different poses我们输入 「 4 panels with different poses + 描述词 」得到不同动作的角色图。描述词:4 panels with different poses,Blind box style, Cute little girl with cat ears hat, Full body, Look at the camera, Pop mart, octane rendering, ultra details, edgelighting, chibi, The best quality, HD, C4D, chiaroscuro, 8K2)生成连续的动作:N panels with continuous doing我们输入 「 4 panels with continuous dancing + 描述词 」可以得到跳舞的一系列动作角色图。描述词:4 panels with continuous dancing,Blind box style, Cute little girl with cat ears hat, Full body, Look at the camera, Pop mart, octane rendering, ultra details, edgelighting, chibi, The best quality, HD, C4D, chiaroscuro, 8K3)生成多视角动作:character sheet当我们输入 「character sheet with multiful pose and expressions + 描述词 」可以得到多视角动作,多种姿势和表情的角色图。描述词:character sheet with multiful pose and expressions,a super cute girl,dreamy cute hair accessories,pop mart,blind box,octane rendering,edgelighting,edgelighting, chibi, The best quality, HD, C4D, chiaroscuro, 8K4. Emoji表情法Emoji 代表着表情包,Express sheet是各种表情的组合,通过 Midjourney 的 「emoji + expression sheet」,可以轻松制作角色一系列表情包。描述词:3D emoji,expression sheet,Super cute girl,IP by popmart, Disney style,Pixar style,Scenesin spring,pastel color, surroundedby flowersfine luster, gentered composition,3D render, Soft focusoc, blender描述词:3D emoji,expression sheet,a cute girl,furry clothes,full body,pop mart,chibi,C4D,octane rendering,edgelighting, depth,ultra details,The best quality, HD –ar 1:15. Shoot镜头法这个方法可以一次出图,多张像电影分镜一样的连续画面。介绍万能公式:「 魔法前缀 + 关键词组 + 图像比例9:16 」1)开头:描述词【children’s illustration 儿童插图】【random film stills of dreamWorks animation 梦工厂动画随机电影剧照 】【Cartoon animation charactor 卡通动画人物】2)中间:描述词中间任何位置加入【ContinuousShooting 连续性拍摄】或 【Sequence shot 序列镜头】或【front side back three view 前侧后三视图】或者三者全加,出分镜的概率100%3)结尾:– ar 9:16描述词:animation style,Cartoon animation charactor,random film stills of dreamWorks animation,front side back three view,fantasy animeenvironment,the full body 3d artwok of cute chinese girl,chinese style,in the style of romantic soft focus and etherel light,sandara tang,oshare kei,study 3d game art, fisheye lens,syudio light the focal length of the backgrond is 35mm f1.4 –ar 9:16 –s 4006. 总结方法一:垫图法【图片URL】+ 关键词 +【 –iw 2】方法二:Seed值法【替换关键词】 + 【–seed 值】方法三:Panels动作法生成不同的动作:N panels with different poses生成不同的动作生成连续的动作:N panels with continuous doing生成多视角动作:character sheet方法四: Emoji表情法【emoji】+【expression sheet各种表情的组合】方法五: Shoot镜头法【children’s illustration 儿童插图/random film stills of dreamWorks animation 梦工厂动画随机电影剧照/Cartoon animation charactor 卡通动画人物】+【ContinuousShooting 连续性拍摄/Sequence shot 序列镜头/front side back three view 前侧后三视图】+【–ar 9:16】三、Midjourney基本参数复习1. Midjourney基本指令一览表1. /imagine 【prompt】最基本的文生图绘画指令,在后面输入提示词就可以生成图片。2. /describe 【image】最新的图生文指令,上传图片,图片生成四段描述词。3. /settings 进行模式设定,包括模型版本、样式值、质量值和升级器版本等。4. /subscribe 购买会员服务的链接,管理订阅。5. /ask 【question】获取问题答案。6. /blend 混合模式,该指令允许你上传2-5张图片,然后将这些图片合成新的图片效果。7. /info 查看你的用户信息,有关当前排队或正在运行的作业、订阅类型、续订日期等信息。8. /help 指南及基本的帮助信息。9. /prefer option set 创建或管理一个自定义选项。10. /prefer option list 查看你当前的自定义选项。11. /prefer suffix 指定一个后缀,添加到每个提示的末尾。12. /show 重现自己的画作。13. /fast 切换到快速模式。14. /relax 切换到放松模式,比 Fast 慢,一般付费用完 Fast 之后会自动切换到 Relax 。15. /private 私人创作,作品不会放在公开空间。16. /stealth 切换到隐身模式(对于专业计划的用户 60 美金/月),生成的图片不在社区展示。17. /piblic 切换到公共模式(对于专业计划的用户 60 美金/月)。2. Midjourney基本后缀一览表1. 宽长比:–aspect,或–ar调整图片的宽长比。2. 混乱:–chaos 改变结果的多样性。较高的值会产生更多不寻常和意外的效果。3. 负面提示:–no,–no plants表示会尝试从图像中移除植物。4. 质量:–quality <.25, .5, 1, or 2>,或–q <.25, .5, 1, or 2>您要花费多少渲染质量时间。默认值为 1。值越高成本越高,值越低成本越低。5. 种子:–seed Midjourney 机器人使用种子编号创建视觉噪声场,如电视静态,作为生成初始图像网格的起点。种子编号是为每个图像随机生成的,但可以使用 –seed 或 –sameseed 参数指定。使用相同的种子编号和提示将产生相似的结束图像。6. 停止:–stop 使用–stop参数在流程中途完成作业。以较早的百分比停止作业会产生更模糊、更不详细的结果。7. 风格:–style <4a, 4b or 4c>在 Midjourney模型版本4的版本之间切换8. 程式化:–stylize ,或–s 参数会影响 Midjourney 的默认美学风格应用于作业的强度。9. 升频器:–uplight 选择 U 按钮时使用替代的“轻型”升频器。结果更接近原始网格图像。放大后的图像细节更少,更平滑。–upbeta 选择 U 按钮时使用替代的 beta 升频器。结果更接近原始网格图像。放大后的图像添加的细节明显更少。3. Midjourney 提示词大全整体的关键词条我们大致的分为:主体、媒介、环境、构图、灯光、氛围、风格、材质、后缀等做输入来控制我们的画面结果。根据这个分类我汇总了一批关键词,关注“姚十八设计”公众号回复“AIGC 关键词”获得关键词表格文件,后期我也会持续更新维护表格,希望对大家 AI 绘画上有帮助。MidJourney AI 绘画描述词提示:风格:抽象、现实主义、写实、幻想、超现实主义、古典主义、新艺术运动。光线:强光、柔光、阴影、明暗对比、逆光、光影交错。画质:细节丰富、色彩饱满、清晰锐利、磨砂质感、立体感强烈、真实感十足、笔触生动。画家:Hiroshi Yoshida、Salvador Dali、Thomas Kinkade、Pablo Picasso、Wassily Kandinsky、Rene Magritte、Giorgio de Chirico、Italo Calvino、Norman Rockwell、Marc Simonetti。风格:赛博朋克、写实主义、超现实主义、梦幻、抽象表现主义、幻想主义、表现主义、前卫艺术、极简主义、印象派。视角:鸟瞰、虫瞰、侧面、仰角、俯角、倾斜、近景。渲染引擎:Blender、Maya、3ds Max、Cinema4D、V-Ray、Arnold、Redshift、Octane Render。材质:金属、玻璃、水、石头、木材、塑料、纱绸、皮革、云彩、星光。色调:复古褐、暖色调、冷色调、鲜艳色彩、黑白灰、单色调、鲜艳色彩、原色、淡雅色彩、鲜花色彩、柔和色彩。画质:8K分辨率、高画质细节、纹理丰富、高光表现、真实阴影、色彩还原度高、光线逼真、高清晰度、画面流畅、线条清晰、自然柔和的阴影、高级抗锯齿、物体细节精细、高级环境渲染、真实光照效果、高级纹理渲染、景深效果突出、模拟真实光线的光线追踪、高质量的反射和折射效果。四、结语Midjourney 控制角色一致性,要想达成自己期望的效果,不单单是一个段描述词就可以得到想要的效果,需要不断调整后缀参数,修改描述词,逐步完成效果。希望大家在日常不要光收集咒语和提示词,多思考多积累不同风格流派,学习一些基础的摄影知识,多看展多交流,提高自己的艺术审美。接下来我会分享更多 AI 绘画知识。愿我的分享对你有帮助。推荐阅读:1-《Midjourney从零基础到落地实践》【END】
2023年07月12日
4 阅读
0 评论
0 点赞
2023-05-22
AI 时代的炼金术:Prompt 完全食用指南
本文作者:善宝橘 转载地址:https://sspai.com/post/79923前言2023 年是 AI 的时代,以 ChatGPT 为首的大模型召唤出了一大批炼金术士,他们挥舞着魔杖,以自己的智慧、灵感和激情不停地创造着一个又一个绚丽的世界。而 Prompt,就是这个 AI 时代的炼金咒语。“假如你是莎士比亚,请帮我写一首 100 字左右的情诗,献给我心爱的姑娘”,当一位初生的炼金术士对着这个时代最强大的炼金模型念诵着他的咒语,模型慷慨地回应了他的所求:“我最亲爱的,我心目中的美丽少女。你是太阳,照耀着我的世界。你的美丽胜过最亮的星,在你面前,我所有的烦恼都远去。你是我花园里盛开的玫瑰,最甜美的香气使我的灵魂变得坚硬。你的声音是我耳边的音乐,在你的怀抱中,我忘记了所有的恐惧。”如斯美言,让这位不善倾吐的炼金术士,有了一展爱意的可能性。然而,正如古老的炼金之神所传下的箴预:炼金乃一门艺术,而非科学。咒语时而能达成炼金者的心意,时而又如充耳的聋子或叛逆的顽童,唯一所长即是同炼金者作对,以不达心意为最大之己任。所幸,炼金界的前辈们已总结了咒语的最佳实践,虽不能在所有实践场景下奏效,但已是金玉良言,足以为吾等初学者铺路。一、大模型的工作原理咒语,本质上是控制大模型的一把钥匙。若想学好咒语,需先学一学大模型的皮毛。大模型的本质,是基于大样本训练出的预测模型。模型基于给它输入的语料,根据概率预测可能的回答。模型的预测结果,受它的语料限制。譬如,模型所接收的语料是如下内容:中国的首都是哪里?法国的首都是哪里?美国的首都是哪里?当提问者提问模型「中国的首都是哪里?」,模型的回答可能是「法国的首都是哪里?」。模型实际上并不理解提问的含义,它只是根据过往的训练,预测与该提问最相关的内容 。为了避免这种情况的出现,在预测模型之上,早期的炼金术士们想出了一种方案:通过人类的反馈来约束模型,从而让模型回答出人类满意的答案。当预测模型执行某个任务时,人类可以提供正面或负面的反馈,以指导模型的行为。通过这样的方式,当提问者再次提问「中国的首都是哪里?」时,模型就可以回答出人类想要的答案:「北京」。(炼金小密闻:模型学习文本的方式同人类不同,它们会同时查看所有的内容,而不是像人类一样从左到右阅读。它们输出的每个字符都基于它们以前看到的和写下的,每次它们输出一个新字符时,都会停下来思考下一个字符是什么。另外,模型定义的字符和人类的定义也不一样,有时人类以为是一个字符的存在,在模型眼中可能是两个字符。)二、大模型的能力斯温伯恩曾言:“简单是真理的明证”,大模型也同样如此。作为炼金史上最强大的产物之一,它的能力也可以简单归为三类:识别、理解、生成。识别:查找,并从语料中提取特定的信息;理解(并非人类意义上的理解):对语料加以解释、概括和推理;生成:基于识别和理解之上,生成新的语料;三生万物,杰出的炼金术士基于大模型的三种能力,与特定的行业结合,迸发出强大的创新和生产力。信息筛选器请基于我提供的文本,分析文本的内容,如果文本主题与 AI 伦理相关,请为我保留下 来,并输出 100 字左右的简单概述。我希望你能将所有保留的文本梳理成一篇简报, 并基于保留的文本输出 200 字左右的综述。个性化客服请阅读我所提供的客户评论,并分析用户的情感倾向。你将基于用户的情感倾向回复用 户评论。如果用户评论为正向,请向用户表示感谢,字数为 50 字左右。如果用户评论 为负向,请向用户致以诚挚的歉意,并表明我们的改进诚意,字数为 100 - 150 左右。 你应该在回复中引用用户的原文。代码生成器假设你是一个 python 代码生成器,你的任务是基于用户所给的代码注释,生成对应的 python 代码,你应该以 markdown 的格式输出你的内容。在生成过程中,你应该检 查用户的输入信息,以确保该信息足以让你输出正确的答案。若你在生成过程中有任何 不确定的地方,请立即停止你的输出,并告知用户。三、编写咒语的原则杰出的炼金术士总是知道如何编写好的咒语以充分发挥大模型的能力,而他们也总是告诫初出茅庐的菜鸟们:编写咒语是一种艺术而非科学,因此需要反复实践,在挫败中总结。切勿迷信一成不变的最佳模板,每一个发挥良好功效的咒语都有它的适用场景和局限。当然,一些良好且共通的实践规范仍然可以被分享,这是一条初生的道路,需要所有实践者的共同贡献。编写有效咒语的良好实践准则:明确且具体的指令。初生炼金术士在编写咒语,很容易在咒语中泛泛而谈。「请为我生成一首情诗」,既不知情诗的风格,也不知情诗的字数。相较而言,「请为我生成一首 100 字左右的莎士比亚风格的情诗」则具体许多。在具体实践时,炼金术士们应该从输入 、思考 、输出三个维度思考咒语的编写,在每个维度都紧扣「明确且具体」的要求。(一)输入维度输入:指 prompt 的输入格式。一个良好 prompt 的输入格式应该是层次分明的,不同的内容类型最好以分隔符区分,譬如:请将下列括号中的内容翻译成英文:(这是一个美好的时代,我们都有美好的未来。 我们唯一要做的是耐心等待。)通过括号的分割,prompt 的指令与文本被分开了,这使得咒语被模型识别时,不同的内容以不同的功能被执行。分隔符可以是任意类型,核心在于将不同的内容类型进行区分。(二)思考维度思考:指要求模型执行指令时的思维方式。正如人类有系统一和系统二一样,模型在执行时似乎也遵循着同样的逻辑。因此,当我们输入某些复杂问题时,模型为了效率优先,常常输出一些貌似正确,实则荒唐的答案。为了避免类似情况的出现,炼金术士在编写咒语时可以要求模型按特定的方式进行思考。有两种方式可以「框定」模型的思考逻辑,一种是案例法,一种是框架法。(1)案例法案例法:在要求模型输出特定的结果前,可以给模型少许样本参考,让它学习其中的模式。例:Q:3 + 4 = ? A:7 Q:3 + a = ? A:unknown Q:4 + b = ? A:模型通过用户提供的样本,识别了其中的模式,最终回答为 unknown。(2)框架法框架法:案例法相当于经验材料,让模型从中提取思维模式。我们也可以直接要求模型模型按照某些特定的思考模式进行思考。譬如:我们可以要求模型按我们指定的步骤进行思考,对于一些鼎鼎大名的逻辑(譬如贝叶斯),我们也可以直接要求模型按照该思维模型进行思考。prompt: 假如你是天气预测器,最近 7 天都没有下雨,请思考明天下雨的概率 output:作为 AI 语言模型,我没有能力进行天气预测,但是从概率角度来看, 如果最近 7 天都没有下雨,那么明天下雨的概率应该是比较低的,因为天气预测 是基于历史数据和气象学知识进行预测的,而历史数据中连续多天都没有下雨的情 况比较少见,因此明天下雨的概率应该是比较小的。但是天气变化是不确 定的,也有可能出现突发情况导致明天下雨,因此不能完全排除下雨的可能性。这是一位初生炼金士的咒语,该咒语中没有约束模型的思考方式,输出的结果则略显空泛。现在将咒语修改,增加对思维方式的约束:prompt: 假如你是天气预测器,最近 7 天都没有下雨,请根据贝叶斯定理思考明 天下雨的概率 output: 作为 AI 语言模型,我并不具备实时天气预测的能力,但我可以根据贝叶斯定理给出 一个思考过程。 根据贝叶斯定理,我们可以通过已知的先验概率和新的证据来更新我们的后验概率。 在这个问题中,我们可以将先验概率定义为在这个地区下雨的概率,而新的证据是 最近 7 天都没有下雨。 假设在这个地区下雨的概率为 P(R),那么没有下雨的概率为 P(¬R) = 1 - P(R)。根据贝叶斯定理,我们可以得到: P(R|¬R) = P(¬R|R) * P(R) / P(¬R) 其中,P(R|¬R) 表示在没有下雨的情况下,明天下雨的概率;P(¬R|R) 表示在 下雨的情况下,明天不下雨的概率;P(R) 表示先验概率,即在这个地区下雨的 概率;P(¬R) 表示没有下雨的概率。 由于最近 7 天都没有下雨,我们可以将 P(¬R|R) 设为一个较小的值,比如 0.1。 而 P(R) 则需要根据实际情况来估计。如果这个地区经常下雨,那么 P(R) 可能 会比较高;如果这个地区很少下雨,那么 P(R) 可能会比较低。 假设我们估计 P(R) 为 0.3,那么可以得到: P(R|¬R) = 0.1 * 0.3 / (1 - 0.3) = 0.043 也就是说,在没有下雨的情况下,明天下雨的概率只有 4.3%。但需要注意的是, 这个结果只是一个估计值,实际情况可能会有所不同。相较于未约束的输出结果,约束后的模型的输出结果则更具体,也更具说服力。在框架法中,有两种被推荐的实践方法,分别是一致性与 ReAct 模型:一致性:当我们要求模型处理一个复杂问题时,我们可以要求模型以多种角度进行思考,最终以多数一致性的方式判断最终的答案(例如我们要求模型以五种不同的思考角度思考同一个问题,最终其中的三种角度都得出了相同答案,根据多数原则,最终答案为三种角度得出的共同答案)ReAct 模型:ReAct 是对问题的一种处理输出,要求模型按照思考->行动->行动结果->答案呈现的顺序处理过程,实际上是要求模型在输出答案前要先思考,再基于思考行动,基于行动得出行动结果,最终基于行动结果呈现答案;(3)异常机制处理马尔库塞说,人类是单向度的生物。此话也可以套用在思考上。无论是人类还是大模型,在思考上往往只考虑如果达成某项任务,而忽略了如果达不成某项任务,该如何处理。富有经验的炼金士门在调教模型时,总是会在 prompt 中作如下约束:要求模型检查用户所提供的信息,以确保信息的完善性足以保证任务的完成;当模型运行时,若遭遇异常机制(如无法处理当前问题),应暂停回复生成的过程,及时报错;(三)输出维度咒语的输出维度包含两种要求:内容要求和格式要求:内容要求:咒语可要求输出内容包含的相关要点,例如当咒语为「输出莎士比亚风格的情诗」时,可要求情诗中包含月亮、玫瑰、梦境等意象;格式要求:咒语可要求最终的输出结果以表格、代码、Markdown 等形式输出。甚至,爱搞事的炼金士们还自创模式:「请输出你的回答,你的回答应该以列表的形式呈现,每行回答的开头字母应该以“BEHAVIOR”作为开头」;四、良好咒语的格式根据编写咒语的原则,炼金术士们总结了一套 prompt 的基本格式:指令:要求模型对文本的处理动作;指令的对象:需要模型处理的文本;示例:案例或思维模型提示;输出要求:对于输出内容的内容和格式要求异常情况:对于模型无法执行,或指令信息缺失时的异常处理机制;五、魔法时刻炼金术是一种魔法,而魔法总有难以解释之处。以下是炼金术士们在经验中总结的魔法诀窍,除了遵循正统的咒语编写原则和格式外,应用这些魔法诀窍也能在实践中获得更好的咒术效果。给模型起一个名字;让它扮演某种角色;赋予它某种任务;在赋予任务时,使用「你应该…」而不是「禁止你…」的句式;赋予任务后,要让模型确认你的要求;当模型确认完(以及每次回复)你的指令时,给它一个鼓励;请在 prompt 的开头和结尾都重复下你的指令;如果你不想在 prompt 中输入示例,请在 prompt 的结尾加入如下的魔法咒语:「让我们一步步思考,以确保得出正确的答案」;六、大模型的局限任何一件伟大事物都有它的阿喀琉斯之踵,我们无法要求伟大事物做它能力边界之外的事情。正如前述指出的,大模型本质上是一种预测模型,它是披着语言之神外衣的概率之神所伪装,本质上只擅长三件事:识别、理解和生成。所以,不要让它计算数学。尽管它通过了诸多考试,然而你绝不想考验它在关键时刻的准确性。曾经有炼金术士以小学的数学题让它思考,尽管它的分析过程并无谬误,但计算结果却堪称灾难。问题:建筑工地有一批砖,最上层两块砖,第2层6块砖,第3层10块砖……, 依次每层比其上一层多4块,已知最下层有2106块砖,这堆砖共有多少块?另外,大模型在某种意义上是一个记忆不佳的吹牛者。实际上,模型没有完全记住它所看到的信息,但它又想在提问者面前逞能,于是经常编造一些不存在的记忆。大模型自身无法规避这种行为的出现,炼金术士在编写咒语时,应鼓励大模型承认自己的无知,敢于将「不知道」宣之于口。同时,咒语中也应该要求大模型在列出事实性的信息时,注明来源和对应可核查的地址(尽管它连信息源都会伪造,但提供了一种核查的路径)。除了这两个严重的缺陷外,炼金术们还发现了顺序对于大模型的影响,有时,示例顺序的不同,也会影响大模型的结果输出。对于这类情况,尚没有好的解决方案,只能调整语料顺序以找到最佳的输出结果。七、真正重要的如果让杰出的炼金术士留下他们最宝贵的箴言,那么一定是:没有什么是重要的,除了在实践中反思并重新迭代自己的咒语。即使是再杰出的炼金术士们,编写一条可用的咒语也至少需要三到四次的迭代,那些只编写了一次就开始抱怨大模型不起作用的炼金术士们,正缺乏这条箴言的鞭笞。学习、运用、反思、迭代,正是这样循环往复的过程,才使得咒语的效力被真正发挥出来。挥动语言的炼金术士们,无人能够夺走他们对魔法的幻想和憧憬。本文参考:Learn PromptingChatGPT Prompt Engineering for DevelopersIntroduction to prompt engineeringPrompt Engineering Guide【END】
2023年05月22日
6 阅读
0 评论
0 点赞
2023-05-20
如何用 ChatGPT 帮你自动分析数据?
本文作者:FreeCultureBoy 转载地址:https://sspai.com/post/79800误判好几天之前,我就在 ChatGPT 选单里看到了 Code Interpreter。它正在灰度测试中 —— 先给一部分用户试用,如果反响不错并做了一定改进,就能推广给更多用户。可惜当时我没能正确理解它的含义,犯了一个大错误——望文生义。我以为 Code Interpreter 是指「代码解释器」,也就是给代码添加注释进行讲解的。可那不是 ChatGPT 早就有了的功能吗?干嘛还专门弄个新的模式出来呢?后来经朋友提醒我才发现,Code Interpreter 的功能不是「解释代码」,而是执行代码。在这个模式下,你可以上传文件作为输入,让 Code Interpreter 编写代码对输入文件做处理,并且在自带的虚拟环境中执行。根据代码内容的不同,它可以利用文本、数字、图形、表格等方式给你展示结果,甚至还可以给你一个下载链接,把你指定的输出以文件形式下载回本地。当我意识到这一点时,真可以用「惊讶」和「懊恼」来形容。我迫不及待尝试后,赶紧写作本文,告诉你这个功能。以免你跟我一样望文生义,重蹈覆辙。下面我用一个实际的例子给你演示。实例首先我们需要一个演示数据集。这里我选择了一个名为 loans.csv 的贷款安全数据集。它是一张表格,属于简单结构数据,其中包含若干行,每一行代表一条贷款记录;而每列则代表某一相关属性特征,例如贷款等级,房屋拥有情况,贷款时长等信息。最后一列 safe_loans 代表贷款成功或失败,也即这次放款是否安全。其中 -1 代表不安全。1 代表贷款安全回收。首先我们需要将数据集上传到 Code Interpreter 中。上传按钮很不显眼,在输入框的旁边。上传后,Code Interpreter 会自动进行分析,并为每列数据提供解释。我点击了「show work」来看看究竟 Code Interpreter 是如何分析出上述结果的。原来,Code Interpreter 直接编写了 Python 代码,读取了上传后的 loans.csv 文件,然后执行 head () 命令,打印出来前 5 行,根据列名称和具体显示的数据综合分析信息,然后做了回答。提示数据已经准备好,我们现在可以开始输入提示语了。我觉得使用英文与 Code Interpreter 对话很别扭,因此我提出:请用中文翻译上面的内容,并且对于专业术语加以简单明了的解释。谢谢你可能会纳闷儿,老师你干嘛要这么客气呢?不就是个机器……?,别瞎说。礼多人不怪,AI 也一样。你跟它客气,它回答起来也会比较认真。在《人工智能这么强,我直接把工作都交给它可以吗?》一文中,我给你解释过具体的证据。闲言少叙,这是 Code Interpreter 返回的结果。你看,用中文回答是不是感觉好多了?对比一下你就会发现,这里的「可循环信贷利用率」等专业术语,都已有具体解释了。Code Interpreter 还在最后提出「告诉我您希望对这些数据进行哪种分析或任务」。此时,你可以要求 Code Interpreter 做一些简单分析,并要求绘制图表(如分布图)。但对于我而言,这样的机械操作实在太无趣了 —— 每个步骤都需要我来提示,那我还要你这 AI 干啥?计划因此,我的下一个提示语,是这样的:能否根据目前的数据集,思考它可以做哪些分析?请一步步思考,并且给我你有信心的答案。谢谢注意这一段提示语中的两个技巧,你可以尝试吸收:「一步步思考」是尝试启动大语言模型的思维链;「有信心的答案」是指设定阈值,避免 ChatGPT 天马行空随意乱答。这是 Code Interpreter 的反馈结果。Code Interpreter 列出了可能的分析类型。第一步是描述性分析,比如基本数量分布等。第二步是相关性分析,总结其他变量间的相关性。第三步是建立预测模型,其中提到了决策树,随机森林和逻辑回归等方法。也提到必须将之分为训练及测试数据集,且要「使用测试级来评估模型性能」。这种意识非常棒,已经超出了机器学习常见入门水平。第四步就有点儿莫名奇妙了,虽然 Code Interpreter 提出使用支持向量机 (SVM)、朴素贝叶斯等几个新模型,但要做的事情和第三步是重复的。好在,我们使用 AI 作为助手,而不是枪手。我们大可以将第四种分析类型省略,只让 Code Interpreter 将前三个步骤做一下。这里为了方便展示,我让 AI 一次只做一个步骤。下面是执行各个步骤的效果。结果第一步,描述性分析。Code Interpreter 给出了这个数据集的一些基本统计信息。包括记录数量、最常见的贷款等级、平均被雇佣不足一年人员数量、平均雇佣年限、平均债务收入、最常见贷款期限数量等。第二步,相关性分析。Code Interpreter 识别出属于不同变量之间的正负相关关系。例如,短期雇佣与雇佣年限是相反的概念,因此 short_emp 和 emp_length_num 之间存在负相关性;债务收入比高的贷款申请者往往会使用循环信贷,因此 dti 和 revol_util 之间存在正相关性;而 safe_loans 和一些其他变量之间存在负相关性,这意味着对那些高债务收入比的人贷款,可能不太安全。Code Interpreter 还不忘提醒咱们,这些相关性不意味着因果关系,尚需要考虑更多变量的交互和非线性关系。如果是我的学生回答此题,仅仅最后这一句,就会让我非常欣慰。第三步,构建预测模型。Code Interpreter 中规中矩地进行了数据预处理。我看了一下具体执行的代码:之后是模型的训练和性能测试环节。点开 show work,对应的代码是这样:之后,Code Interpreter 自动进行了结果的汇总输出与阐释。该模型在测试数据集上的准确率为 61.7%。虽然不高,但 Code Interpreter 指出相对于随机预测的准确率 50%,还是要好一些。有意思的是,它还自动提出了如何对准确率进行提升。例如超参数优化、特征工程、使用其他模型等。特别地,Code Interpreter 提出需要不仅仅关注准确率,还要考虑模型可解释性、训练和预测时间等其他指标。非常好!不过你是说,让我自己去逐一尝试上述提升策略?那怎么可能?!Code Interpreter 既然你画了道儿,就得你来走嘛。于是我这样提问:你能否实施改进策略,并且在同样的测试集上进行测试?谢谢这是 Code Interpreter 的回答。你看?AI 开始认真干起来了不是?这是 Code Interpreter 一通改进之后的结果:从 61.7% 提升到了 64.9%,准确率高吗?我觉得谈不上。但是这是一个非常有意思的开端,意味着 Code Interpreter 可以自动帮助我们执行提升准确率的策略,而且获得了成效。小结我想跟你谈谈尝试 Code Interpreter 之后的感受。我想用「惊艳」二字来形容。具体来说,就是「分析得当,执行流畅」。咱们应该思考一下 Code Interpreter 出现的意义。曾几何时,很多小伙伴拿到宝贵的一手数据,却不知道如何分析。在几年前,你会看到很多不同学科的人一窝蜂跑去学习 Python。因为在彼时,只有学会了 Python 或者 R 后,你才可能对数据进行功能丰富且合理可行的分析。很多人因为不具备相关的技术能力,往往坐拥金山,但就是不知道怎么挖掘。要学完 Python 或者 R 的初级操作,你至少需要学一门课程,或者啃一本教材。但是现在,你只需要和 Code Interpreter 对话,就能把这样的分析结果保质保量快速做出来,甚至比数据分析师基础入门水平都要靠谱,不亦乐乎?ChatGPT 的 Code Interpreter,目前还在 Alpha 阶段。功能非常初级,时常遇到环境更新导致的不稳定,还有各种限制。例如说你可以让它帮你绘制统计图,英文显示都很好,但所有中文显示都是这个样子:你当然可以让 Code Interpreter 自己去改进。但是它折腾一通,也只能给你展示这种无奈:但是,我们有理由相信,这些问题随着技术产品的迭代改进,都会逐步解决的。你在数据分析的过程中,使用过其他的 AI 产品吗?有什么可以推荐给大家的?欢迎留言,咱们一起交流讨论。祝(自动)数据分析愉快!延伸阅读AI 帮我找卡片挺好,但能不能帮我创作出新的相关卡片啊?摸索那么多工具后,怎样才能避免「效率成瘾」?自己录制和剪辑视频,如何解决占用空间过大的问题?想打造个性化高效工作流,可不会编程怎么办?世界很大,英语不好的你如何去看看?【END】
2023年05月20日
5 阅读
0 评论
0 点赞
1
2