爱盲论坛

标题: 问下有谁在玩这个东东。 [打印本页]

作者: 白开水    时间: 2024-9-8 21:46
标题: 问下有谁在玩这个东东。
智谱清言,我看他们用这个可以看你周边有什么东西还能看你自己挺好玩的,就是我不会玩,谁知道怎样玩。说一下,谢谢。

,内容来自,心明世界
作者: 简单的快乐0917    时间: 2024-9-8 23:40
不是特别好用,镜头都换了好几个地方了,你提问大多数还是给你回答的前面几个场景
本帖来自微秘iOS端
作者: 水仙花    时间: 2024-9-9 06:37
标题: 回复楼主白开水
9楼 浮华若梦说:
回复8楼陈家三少
点击语音通话,然后找到一个视频的按钮双击,就切换到视频了。
本帖来自微秘
发表于: 1?小时前应该还能记得,前几个月
OpenAI
发布会上,演示的多模态产品
gpt4O
的多模态交互给我们带来的震撼。相比于拍照
/
上传图片的交互方式,视频通话显然能给我们带来更多的可能性。于是,我们开始翘首以盼。
然而,这一等就是几个月,就算是gptPlus用户也还没用上高级的视频功能。没想到国产大模型却先来了。
图片
「智谱清言APP」的视频通话功能在8月30日正式上线,向部分用户开放,同时接受外部申请。我是这周二下午填写的申请表单,第二天就得知已经可以使用了。下面迫不及待给大家讲讲使用感受。
315,更新于2015-09-2509:46
优势:
视频通话的交互方式对于我们来说十分方便。免去我们手动拍照或自己上传图片的额外操作;也不用手动输入问题,我们可以随时打断,随时语音提问;得到的是及时的语音反馈,也不用再去手动查看结果。
总结一句话,它更像是一个虚拟的视频志愿者了。
不足:
交互方式确实很先进,然而实际使用效果吗,还需要继续提升。
粗线条描述还很生硬,我们想要的细节需要多轮提问可能才会得到相对好的回答。然而这很挑战我们的提问技巧,以及多轮提问之后,你还会尴尬地发现,它前后矛盾了。
十分不客观,会说出一些本来没有的东西。这还了得,把黑的说成白的,会让你严重怀疑,这家伙的可靠性。
主观评价,就那几句话反复重复。“看起来不错,十分温馨的房间”;“真的好漂亮,十分舒适的环境”。它对这个世界仿佛加上了滤镜,什么都是无比美好的东西。
接下来,给大家提供一个使用录屏,简单体会一下。
播放视频,时长01:34
显示工具栏
使用方法
虽说,有那样这样的不足,但是它免费,并且不需要特殊网络支持。视频功能不排除以后收费的可能性,大家且用且珍惜。
目前最新版软件已经不需要额外申请就能直接使用了。如果大家想尝鲜的话,可以按照下面步骤操作。
提示:
作者使用的是安卓手机,读屏为解说,因为软件存在大量的未加标签的元素,为了区分元素,我开启了解说的“读出未定义标签id元素”功能。
理论上某坦读屏也可以开启图标描述,实现差不多的效果;
iphone用户可以参考,大同小异。
以下图片均为各步骤截图
1.应用商店下载“智谱清言”,可不是“智谱青年”啊。刚开始我也听错了,哈哈哈。
图片
2.如果已经下载了,那就要更新到最新版,最新版的版本号为2.5.0,这几天APP迭代十分频繁,一定要保持软件最新版哦。
图片
3.登录注册,跳过广告业自不必说,无障碍没问题。
4.进入APP,默认就是对话页面,如果不是可以双指右滑几次切换到最左边的个人中心页面,再双指左滑就可以切换到第二个对话页面了。
图片
P.S.:APP顶部几个按钮可以切换到对应的页面,我们经常使用的是第二个对话页面,大家也可以直接点击切换,但是注意它们都是未加标签的按钮。
5.对话页面功能入口简单介绍。
图片
首先我们在屏幕下底部,触摸浏览找到“输入@,召唤智能体”;
接着右滑一次可以听到“xxx?photo”,其他读屏软件可能有不同的提示,更有可能不提示,这里就是拍照添加图片的按钮;
继续右滑一次,听到“xxxx?编辑框”,这里就是输入文字聊天的输入框了;
再次右滑,听到“xxx?voice”,这里可以切换语音输入;
最后再右滑一次,听到“xxxvoicecall”,这就是视频通话入口了。
总结一下:以编辑框为参照,左边是图片入口,右边两个依次是语音入口和通话入口。
6.视频通话页面介绍。
图片
点击进入通话页面之后,你就可以听到一个女生主动跟你打招呼,这时候我们就可以跟她语音交流了。
页面上有三个按钮,不同APP版本,按钮数量可能有所区别。
左边是静音,中间是挂断,右侧就是打开摄像头的按钮,默认我们是没有打开摄像头的,点击一下,开启摄像头,我们就可以正式开始与智谱清言视频对话了。
P.S.:iphone旁白用户补充:
屏幕顶端个人、会话、广场等按钮有标签;返回按钮需要屏幕识别才能找到;编辑框旁边的按钮是英文哦。
未来的可能性
虽说现在智谱清言的实际表现,还差强人意,然而这样的交互方式,却让我们有了更多想象空间。
我们可以设想一下,随着镜头的转动,让AI帮我们找东西;在川流不息的马路边,让AI给我们扫描出我们想要的车辆。更多的动态场景,那可太多了。
我们想要拥有一个ai电影解说员,一个ai出行引导员,一个ai导购员,等等等等。
总之,一切皆有可能,只不过等待可能更加漫长。
另外,“bemyeyes”在接入gpt视频模型的表现,也值得我们进一步期待。
图片
-End文章结束-
温馨提示
本文系作者原创作品
文中所述内容,所列经验仅代表作者个人观点,不代表本公众号立场。
所有内容仅供参7楼 外星人在宇宙
在编辑框下一个按钮就是语音通话,上一个事按住说话,语音通话的下一个事加号,能拍照识别和上传文件分析,我觉得用不上家标签吧,语音通话里只有两个,一个静音一个挂断。我咳咳上午下载回来摸了一下
本楼来自:智慧人生VIP会员
今天 16:14:561楼抉择1 点击语音通话,点击右下角的视频以后,它里边还有很多的按钮,比如说相机的切换,我想问一下,切换前置摄像头和后置摄像头在哪一个方向?所以他也不读,希望那个老师能看到的话帮我描述描述。 本楼来自 天坦百宝箱 分组
3楼江浸月 屏幕探测,然后自己摸索一下就知道了。 分组
4楼水莲花 回2楼笑面书生 没有申请入口就对了。现在注册的不需要申请了。登上视频通话就能用了。 本帖来自微秘安卓版 分组
6楼笑面书生 我的版本是2点4点9 分组
7楼笑面书生 下面就有三个按钮麦克风和文字的切换右面是一个拨号这里面也没有视频识别呀 分组
11楼水莲花 回1楼抉择1 打开软件。底部有4个按钮。左边第1个按钮读英文的,如果当前是文字编辑状态他就读英文。如果是按住说话,他就读声音。也就是说当这个按钮读声音的时候。从左往右数第2个按钮,就读按住说话。以此类推。从左往右数第3个按钮,当没开启通话的时候他读拨号。点击这个拨号就打开了语音通话。从左往右数第4个按钮,就是开关摄像头的。当摄像头关着的时候,他读添加。点开这个添加就开启了摄像头。我这边默认摄像头是后置。开启摄像头之后,这个添加按钮就变成了删除。找到这个按钮,沿着右侧边缘往上摸。第1个按钮就是前后摄像头切换。也是读英文的。啰里啰嗦说了这么多,也不知楼主能否看得明白。 本帖来自微秘安卓版 分组
16楼抉择1 点进那个麦克风,也就是语音通话,点进去以后右下角有一个视频。 本楼来自 天坦百宝箱 引用 笑面书生: 下面就有三个按钮麦克风和文字的切换右面是一个拨号这里面也没有视频识别呀 分组
17楼抉择1 说错了。点击那个拨号按钮点进去,右下角那个是视频,其他的按钮是什么,我就不知道了。 本楼来自 天坦百宝箱 引用 笑面书生: 下面就有三个按钮麦克风和文字的切换右面是一个拨号这里面也没有视频识别呀 分组
20楼抉择1 如果通过了视频通话以后点击最右下角那个是个上传图片,再往左一点那个是个语音通话。点进去语音通话之后,它有三个按钮。最右面的是视频,再往左一点点是挂断,再往左一点点是语音通话。他一般默认的就是语音通话,你要想让他视频通话以后点击语音通话,点进去以后再点击视频通话,这个是不读的,他读的是一些英文,你可以图形命名一下。图形命名的时候字数不能多了,多了也不行,你只能写个视频。挂断语音这几个字就可以。 本楼来自 天坦百宝箱 分组
本帖来自微秘
作者: 水仙花    时间: 2024-9-9 06:39
标题: 回复楼主白开水
上面的我复制了几个,好几个帖子的回帖,里面说的很详细了,在后面的那些内容里,你想用的话,仔细听一下,,使用很简单
本帖来自微秘
作者: 预知未来的我    时间: 2024-9-9 07:13
标题: 回复楼主白开水
你也是有不会的啊。说实话每个人都是从无到有。一些知识还是需要学习的。只有不断的折腾才不会被社会淘汰了。
本帖来自微秘
作者: 大度看世界    时间: 2024-9-9 07:14
标题: 回楼主白开水
我制作了这个软件的详细使用教程,如果你需要,可以加群下载QQ群号码:207375162。
本帖来自微秘安卓版
作者: 白开水    时间: 2024-9-9 07:18
回复 沙发简单的快乐0917

谢谢,明白了

来自:掌上乐园
作者: 白开水    时间: 2024-9-9 07:19
回复 板凳水仙花

谢谢你。说的非常清楚了。请问你在哪个论坛看见的,怎么我没有找到这一些。

来自:掌上乐园
作者: 白开水    时间: 2024-9-9 07:22
回复 6楼 大度看世界

ok加上看一看。谢谢

来自:掌上乐园
作者: 水仙花    时间: 2024-9-9 07:32
标题: 回复8楼白开水
在争渡论坛里看到的
本帖来自微秘
作者: 白开水    时间: 2024-9-9 15:40
回复 10楼 水仙花

谢谢。

,内容来自,心明世界




欢迎光临 爱盲论坛 (https://aimang.net/) Powered by Discuz! X3.2