必死チェッカーもどき自作PC > 2020年07月11日

トップページ > 自作PC > 2020年07月11日 > DaPRRzxK

書き込み順位＆時間帯一覧

15 位/2401 ID中	時間	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	Total
15 位/2401 ID中	書き込み数	0	0	0	0	0	0	1	0	0	0	0	0	0	0	0	2	3	1	0	2	2	2	1	3	17

使用した名前一覧	書き込んだスレッド一覧
MACオタ＞809 さん MACオタ＞833 さん MACオタ＞836 さん MACオタ＞839 さん MACオタ＠補足 MACオタ＞844 さん MACオタ MACオタ＞850 さん MACオタ＞851 さん MACオタ＞858 さんその他6個すべて表示する	CPUアーキテクチャについて語れ 48

書き込みレス一覧

CPUアーキテクチャについて語れ 48
810 ：MACオタ＞809 さん[]：2020/07/11(土) 06:01:44.96 ID:DaPRRzxK: >>809
スマホ用BGAリワーク機すら出回っている昨今、出来るヒトにわ可能、出来ないヒトにわ一生無理という感じになるかと。
現代においてデジタルデバイドってのわ、もはやコンピュータを使える使えないの問題で無くなっているいるす

CPUアーキテクチャについて語れ 48
834 ：MACオタ＞833 さん[]：2020/07/11(土) 15:05:35.92 ID:DaPRRzxK: >>833
>>831 が意味不明なのわ同意するすけど intel の拡張命令わ MKL 経由で性能を享受してるヒトが多いのでわ？

特に大学の計算機センターなんかわ必ず intel コンパイラのライセンス買ってるし。。。

CPUアーキテクチャについて語れ 48
837 ：MACオタ＞836 さん[]：2020/07/11(土) 15:45:23.86 ID:DaPRRzxK: >>836
知ったかご苦労様すけど、レジスタ幅 512-bit わベクトルでなく SIMD に分類されるす
https://blog.global.fujitsu.com/jp/2016-08-23/01/
ーーー
また、UNIXプロセッサは、スパコンの技術であるSIMD（Single Instruction Multiple Data）を採用し、1度に複数のデータの演算処理を実行させることができます。
ーーー

CPUアーキテクチャについて語れ 48
840 ：MACオタ＞839 さん[]：2020/07/11(土) 16:09:32.04 ID:DaPRRzxK: >>839
>例外はあれどSIMDはベクトルを処理するのに使われる

その観点でわ現代の PC 向けプロセッサわ全てベクトル機と呼べるので富岳を特別視するヒトわ、やはりおバカさんという結論に。。。

>昔のベクトル機だとワンチップ化されてなかった可能性がある。

8087 わ 8086 とわ別チップコプロセッサすけど、その命令わ x86 ISA の一部す。「命令」がメモリ上に記録されたコードの羅列に過ぎない以上、デコーダーが解釈するのが ISA なのであってハードウェアの詳細わ関係無いす。

CPUアーキテクチャについて語れ 48
843 ：MACオタ＠補足[]：2020/07/11(土) 16:19:13.16 ID:DaPRRzxK: >>840 の補足すけど、逆に最新のプロセッサであっても GPU 内蔵品わ非公開の全く異なる命令体系を持つ演算ユニットの集合体す。
結局昔と今の違いわ単なる半導体の集積度に過ぎないす。過去に何か特別なコトがあったかの様に語るのわ、狭い視点でわ無いすかね？

CPUアーキテクチャについて語れ 48
845 ：MACオタ＞844 さん[]：2020/07/11(土) 16:46:15.24 ID:DaPRRzxK: >>844
>でも質問者が現代と昔のちょっとの差を意図して質問している可能性はあるので

ここから先の話わ異論がある方がいるかもしれないすけど、牧野教授あたりわベクトルと SIMD の間に、その成り立ちに起因する本質的な違いがあると述べているす。
「スーパーコンピューティングの将来」
7. SSE の限界(2005/12/23)
ーーー
ソフトウェアの側から見るなら、 Cray-1 のベクトルレジスタが 64 語だったものが 2 語になった、と見ることもできなくはありません。しかし、ハードウェアの実装は根本的に違います。
ベクトル計算機では長いベクトルレジスタに対して演算器は(もっとも単純な形では)1つだったのに対して、SSE/SSE2 では基本的には 4/2 個の演算器が並列に動くからです。

この違いは、なんのために SSE 命令なりベクトル命令なりを導入したか、という目的の違いによっています。
既に見たように、ベクトル命令は比較的簡単なハードウェアで1つの演算器を有効に使うために導入された、といってよいと思いますが、 SSE はありあまるハードウェアを少しは演算にも使おうというものです。
ーーー
NGワード関係で直リンできないコトをお詫びするす

CPUアーキテクチャについて語れ 48
847 ：MACオタ[]：2020/07/11(土) 17:35:31.43 ID:DaPRRzxK: 牧野教授の「スーパーコンピューティングの将来」の最新記事を読むと、A64fx ってメモリわ超高速なのに演算器とキャッシュが遅いと言う妙な設計なんすね。。。
姫野ベンチを設計時に無理強いするとこうなるすか？
147. 某マシン上の差分ステンシル計算 (2020/6/6)
ーーー
SIMD 幅は広く、レジスタ数が少なく、演算器レイテンシが大きく、L1 はあまり大きくなく、バンド幅もL2はそこそこあるがレイテンシが大きくてバンド幅も小さいマシンを考えてみます。もちろん、具体的な対象は A64fx です。
「京」も同様な問題があったのですが、「陽解法規則格子流体でピーク性能の 10ー15%しかでない」ということについてです。
ーーー
NGワードで直リンできないコトをお詫びするす

CPUアーキテクチャについて語れ 48
852 ：MACオタ＞850 さん[]：2020/07/11(土) 19:03:45.05 ID:DaPRRzxK: >>850
Xeon Phi わ small-core + many-core + SMT4 で SUN Niagara や GPU の様にもっとスループットコンピューティング寄りだと思うす

CPUアーキテクチャについて語れ 48
853 ：MACオタ＞851 さん[]：2020/07/11(土) 19:14:41.68 ID:DaPRRzxK: >>851
>1チップ52コアは4コアが制御コア48コアが演算コア

OSの割り込みが入ると計算コアの同期に乱れが生じるのでメニーコアでわ良くある構成す

コレわBG/Qの例
https://ascii.jp/elem/000/001/012/1012242/
ーーー
これを集積したBlue Gene/Qチップの全体が下の画像だ。360mm2のダイに、合計18ものプロセシングユニット(A2＋QXP)を集約しており、このうち16個が計算、1個が通信管理などOSの作業に割り当てられている。
ーーー

CPUアーキテクチャについて語れ 48
859 ：MACオタ＞858 さん[]：2020/07/11(土) 20:28:18.07 ID:DaPRRzxK: >>858
CELL BE も SPE 数を増やした将来版でわ PPE も増えるコトになっていたす
https://www.itmedia.co.jp/news/spv/0911/25/news030.html
ーーー
次世代版CELL「PowerXCell 32i」を開発中止すると語っていた。このプロセッサは、2個のPPE（PowerPC Processor Element）と32個のSPE（Synergistic Processing Elements）を搭載する計画だった。
ーーー

CPUアーキテクチャについて語れ 48
861 ：MACオタ＞855 さん[]：2020/07/11(土) 20:57:25.62 ID:DaPRRzxK: >>855
インタコネクトの強化わ正統進化だった様す。

コレ「京」派生システム唯一の海外案件である台湾気象局の報告書すけど、FX10 (SPARC64 VIIIfx) と FX100 (SPARC64 XIfx) を比較してるす
http://photino.cwb.gov.tw/rdcweb/lib/cd/cd03cons/compilation/2018/107M08_p65.pdf
ーーー
在模式運行效能測試方面，本年度以 C768 解析度，垂直層數 63 層，積分 步長為 225 秒為基準分別在氣象局 FUJITSU FX10 及 FX100 上進行測試，模式在積分中計算速率是穩定的，
在 FX10 上計算核心數目增加 2 倍對於計算速率大致上可增加 1.8~1.9 倍，以 1536 顆核心積分 5 天花費時間約為 6.87 小時;
而在 FX100 上以 1536 顆核心積分 5 天花費時間約為 2.44 小時，FX100 大致上比 FX10 計算速率快上 3 倍，但在 FX100 上使用超過 768 顆核心之後，增加 2 倍計算核心數目，計算速率增加約 1.64 倍。
ーーー
要するに同一コア数でわ FX100 の方が3倍早いが、スケーラビリティに注目すると FX10 でわコア数と性能が比例していたのに、FX100 でわ768コア以上の領域でコア数を2倍に増やしても性能わ1.64倍しか向上しなかったとあるす。(図2.8、図2.9参照)
シュリンクしてコア数/性能が上がってもインタコネクトが限界だった様で。。。
なおSPARC64 VIIIfx と XIfx の比較わコレす
https://jp.fujitsu.com/platform/server/advantages/sparc64processor/

CPUアーキテクチャについて語れ 48
862 ：MACオタ＠訂正[]：2020/07/11(土) 21:01:49.23 ID:DaPRRzxK: >>861 の訂正す。PRIMEHPC FX10 のプロセッサわ京の次世代 SPARC64 IVfx す

SPARC64 VIIIfx わ京コンピュータそのものすね

CPUアーキテクチャについて語れ 48
863 ：MACオタ＞857 さん[]：2020/07/11(土) 21:11:16.82 ID:DaPRRzxK: >>857
>>487 にも書いたすけど現段階で Tofu-D のドライバ/ネットワーク・スタックが普通の Linux でわ動かせない様に見えるす
富士通純正の FX700 すら OS が RHEL なので Infiniband 搭載す

CPUアーキテクチャについて語れ 48
865 ：MACオタ＞864 さん[]：2020/07/11(土) 22:42:52.15 ID:DaPRRzxK: >>864
下記のプレゼンのp.20あたりが参考になるかと。
http://www.ipsj.or.jp/sig/os/index.php?plugin=attach&refer=ComSys2019&openfile=fugaku_system_software.pdf

富岳専用アプリわ直接 Linux システムコールを呼ばないす

CPUアーキテクチャについて語れ 48
866 ：MACオタ[]：2020/07/11(土) 23:02:37.48 ID:DaPRRzxK: >>487 のリンク先の安藤壽茂氏の記事によると
ーーー
このため、理研はOS Jitterの小さいMcKernelという軽量OSを開発し、計算コアではMcKernelを使っている。一方、IO処理などの割り込みが必須な処理もあるので、こちらはアシスタントコアでLinuxを動かして実行する。

マネジメントソフトウェアやファイルシステムの開発は富士通が分担している。プログラム開発環境は並列プログラミング言語のXcalableMPとMPI通信用のMPICHは理研が開発しており、残りの部分は富士通が開発している。
ーーー
Tofu-D 対応の MPI わ McKernel 対応アプリ上でしか動かない感じす

CPUアーキテクチャについて語れ 48
868 ：MACオタ＞867 さん[]：2020/07/11(土) 23:11:07.80 ID:DaPRRzxK: >>867
>>866 を素直に読むと、Linux kernel をアシスタントコアでしか動かさない特殊なスケジューリング機能を持つ専用 BIOS/Firmware が動いている様に見えるす

一方で McKernel わ A64fx 専用機能のドライバを含んでおり、アシスタントコアやら Tofu-D やらのドライバはこっちにしか無い。。。というのが私の推測す

CPUアーキテクチャについて語れ 48
870 ：MACオタ＞869 さん[]：2020/07/11(土) 23:30:02.54 ID:DaPRRzxK: >>869
MPI 等わレイテンシ勝負だからす

ハードウェアがどれだけ高速でも余計なソフトウェア・レイヤを経由すると無意味になるのわ RAM ディスクなどを使った経験があれば体感してるかと。。。

※このページは、『２ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の２ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。