c/c++语言开发共享CPU和数据对齐-计算机技术网

请原谅我，如果你觉得这已被无数次回答，但我需要回答以下问题！

CPU是面向字的，而不是面向字节的。在简单的CPU中，存储器通常被配置为每个地址选通返回一个字（32位，64位等），其中底部的两个（或更多）地址线通常是无关位。

对于许多指令，Intel CPU可以对非字边界执行访问，但是由于内部CPU执行两次存储器访问并且数学运算加载一个字，因此存在性能损失。如果您正在执行字节读取，则不应用对齐。

某些CPU（ARM或Intel SSE指令）需要对齐的内存，并且在进行未对齐的访问（或抛出exception）时具有未定义的操作。它们通过不实现更复杂的加载/存储子系统来节省大量的硅空间。

对齐取决于CPU字大小（16,32,64位），或者在SSE的情况下取决于SSE寄存器大小（128位）。

对于你的上一个问题，如果你一次加载一个数据字节，大多数CPU都没有对齐限制（某些DSP没有字节级指令，但很可能你不会碰到一个）。

很少有数据“有”对齐。更多的是某些类型的数据可能表现更好或某些cpu操作需要某种数据对齐。

首先，假设您一次读取4个字节的数据。我们还说你的CPU有32位数据总线。我们还要说您的数据存储在系统内存中的字节2处。

既然你可以一次加载4个字节的数据，那么让你的地址寄存器指向一个字节并没有多大意义。通过使地址寄存器指向每4个字节，您可以操作4次数据。换句话说，你的CPU可能只能读取从字节0,4,8,12,16等开始的数据。

所以这就是问题所在。如果您希望数据从字节2开始并且您正在读取4个字节，那么一半数据将位于地址位置0而另一半位于位置1。

所以基本上你最终会打两次内存来读取你的一个4字节数据元素。某些CPU不支持此类操作（或强制您手动加载和组合两个结果）。

请访问此处了解更多详情： http ： //en.wikipedia.org/wiki/Data_structure_alignment

1.）有些架构根本没有这个要求，有些架构鼓励对齐（访问非alignet数据项时存在速度损失），有些架构可能会严格执行（错误导致处理器exception）。
当今许多流行的架构都属于速度惩罚类别。 CPU设计人员必须在灵活性/性能和成本（硅片面积/总线周期所需的控制信号数量）之间进行交易。

2.）什么语言，哪种架构？请参阅编译器手册和/或CPU体系结构文档。

3.）同样，这完全取决于体系结构（某些体系结构可能根本不允许访问字节大小的项，或者总线宽度甚至不是8位的倍数）。因此，除非您询问特定的架构，否则您将无法获得任何有用的答案。

一般来说，所有这三个问题的答案都是“这取决于你的系统”。更多细节：

它完全取决于您使用的CPU！

有些架构只处理32个（或36个）位字，你需要特殊的指令来加载单个字符或haalf字。

一些cpus（特别是PowerPC和其他IBM risc芯片）不关心对齐，并将从奇数地址加载整数。

对于大多数现代体系结构，您需要将整数与单词边界和长整数对齐以使单词边界加倍。这简化了加载寄存器的电路，并且速度非常快。

出于性能原因，CPU需要数据对齐。英特尔网站提供了有关如何对齐内存中数据的详细信息

迁移到64位英特尔®架构时的数据对齐

其中之一是数据项的对齐 – 它们在内存中的位置与四倍，八倍或16字节的倍数相关。在16位英特尔架构下，数据对齐对性能几乎没有影响，它的使用完全是可选的。在IA-32下，正确对齐数据可能是一个重要的优化，尽管它的使用仍然是可选的，只有极少数例外，其中必须正确对齐。但是，64位环境对数据项提出了更严格的要求。未对齐的对象会导致程序exception。要使项目正确对齐，它必须满足64位英特尔架构（稍后讨论）以及用于构建应用程序的链接器的要求。

数据一致性的基本原则是最安全（并且得到最广泛支持）的方法依赖于英特尔所说的“自然界限”。当您将数据项的大小向上舍入为下一个最大大小的两个，四个，八个或16个字节时，会出现这些。例如，一个10字节的浮点数应该在一个16字节的地址上对齐，而64位的整数应该与一个8字节的地址对齐。因为这是一个64位架构，所以指针大小都是8字节宽，因此它们也应该在8字节边界上对齐。

建议所有大于16字节的结构在16字节边界上对齐。通常，为获得最佳性能，请按如下方式对齐数据：

应该对齐64字节或更大的数据结构或数组，使其基址是64的倍数。按递减大小顺序排序数据是一种用于辅助自然对齐的启发式算法。只要16字节边界（和缓存行）永远不会交叉，自然对齐就不是必需的，尽管这是一种强制遵守一般对齐建议的简单方法。

在结构中正确对齐数据可能会导致数据膨胀（由于正确放置字段所需的填充），因此在必要且可能的情况下，重新组织结构以使需要最宽对齐的字段首先在结构中是有用的。有关解决此问题的更多信息，请参阅“为IA-64架构准备代码（代码清理）”一文。

对于英特尔架构，英特尔64和IA-32架构的第4章数据类型软件开发人员手册回答了您的问题1。

以上就是c/c++开发分享CPU和数据对齐相关内容,想了解更多C/C++开发(异常处理)及C/C++游戏开发关注计算机技术网(www.ctvol.com)!)。

本文来自网络收集，不代表计算机技术网立场，如涉及侵权请联系管理员删除。

ctvol管理联系方式QQ:251552304

本文章地址：https://www.ctvol.com/c-cdevelopment/555214.html

c/c++语言开发共享CPU和数据对齐

精彩推荐