4. 机器翻译任务-尧图网站设计

seq2seqSequence to Sequence架构翻译任务seq2seq模型架构包括三部分encoder(编码器)、decoder(解码器)、中间语义张量c。图中表示的是一个中文到英文的翻译欢迎来北京 - - welcome to BeiJing。编码器首先处理中文输入欢迎来北京”通过 GRU模型获得每个时间步的输出张量最后将它们拼接成一个中间语义张量c接着解码器将使用这个中间语义张量 c以及每一个时间步的隐层张量逐个生成对应的翻译语言。早期在解决机器翻译这一类 seq2seq问题时通常采用的做法是利用一个编码器 (Encoder)和一个解码器 (Decoder)构建端到端的神经网络模型但是基于编码解码的神经网络存在两个问题问题1如果翻译的句子很长很复杂比如直接一篇文章输进去模型的计算量很大并且模型的准确率下降严重。问题2在翻译时可能在不同的语境下同一个词具有不同的含义但是网络对这些词向量并没有区分度没有考虑词与词之间的相关性导致翻译效果比较差。解释先把这3个词转成Embedding即词嵌入一个向量每个时间步通过 GRU也叫 RNN循环神经网络本身是通过循环神经网络每个时间步都会得到一个隐藏层张量的输出‘欢迎‘ 送到GRU得到 h1、‘来’ 送到GRU得到 h2、‘北京’ 送到GRU得到 h3、这些h1 h2 h3是每个时间步的输出张量即将 3个单词进行 GRU进行转换当前只有一个样本即一个句子 batch_size13个单词即 seq_len3input[1 35]GRU5,101则 output[1, 3, 10]此 output就是中间语义张量 C它承接了所有编码信息即原始的中文语义信息拿到 C之后再一个时间步一个时间步解码或者说翻译也可以将 output中 3个张量1、3、10相加再平均来充当 C。hn[1, 1, 10] 也可以充当 C因为它代表了最后一个单词输出的词向量维度它已经具备了上下文所有的语义三种说法① 可以用 output结果充当 C因为它具备了上下文整个编码所有信息② 可以把这 3个张量相加再平均来充当 C③ 可以拿最后一个单词词向量维度当做 C因为三者都包含了原始语义的所有信息。拿到 C之后编码器部分和中间语义张量 C结束。每一步在翻译出新单词时都要用到中间语义张量 C因为翻译成英文时必须要知道原始中文。如解码预测时根据拿到的中间语义张量 C如何预测出 ‘welcome’首先要有一个 GO表示翻译的开始字符(对应有一个翻译的结束字符 EOS-End of Sentence)‘GO’这个单词变成 Embedding此 Embedding再和中间语义张量 C共同送给 GRU来预测出 ‘Welcome’图中的 S0、S1、S2、S3都是隐藏层张量它们不仅可以横向箭头也可以向上箭头表示但向上的如 S1不能直接得到 ‘welcome’它要经过一个 nn.Linear() 因为 linear才能输出才能进行预测。图中 GRU接收了 3个参数中间语义张量 C、GO、S0

4. 机器翻译任务

相关新闻

别再傻傻重启电脑了！Windows下用netstat和taskkill一键清理端口占用的保姆级教程

别再手动改乱码了！用convmv命令5分钟批量搞定Linux中文文件名编码转换

git分支合并的切换逻辑详解

手把手教你用ATE测试程序搞定EEPROM的IIC读写与参数测试（附完整代码解析）

保姆级教程：用NoMachine远程连接Linux桌面，手把手解决Firefox打不开的问题

Windows 11下SecureCRT 8.5安装激活全攻略（附注册机与避坑指南）

告别脆弱测试！Postman Mock Server实战：构建稳定、可复用的接口自动化测试桩

0203航天篇：大规模星座发射全域收敛实证：1.0实体发射体系必然堵死

如何快速配置黑苹果？OpCore Simplify自动化工具让OpenCore EFI创建变得简单

Harness 中的响应合并：将多个片段组装为完整输出

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源

【英语学习笔记】基于“底层逻辑转换”与“去动词化”的英汉互译核心方法论及写作高分公式

终极视频下载解决方案：VideoDownloadHelper 完全指南

2026最新！AI论文写作工具测评：这几款知网都认可

Harness 中的响应合并：将多个片段组装为完整输出

Windows Cleaner终极教程：5分钟彻底解决C盘爆红问题，让系统重获新生！

别再只会用ifconfig了！在Ubuntu 22.04/20.04上，教你用ip命令并顺带配置好国内镜像源