狠狠撸
Submit Search
骋笔鲍による多倍长整数乗算の高速化手法の提案
Nov 23, 2012
Download as PPTX, PDF
2 likes
2,216 views
Koji Kitano
1 of 26
Download now
Downloaded 11 times
Recommended
骋笔鲍による多倍长整数乗算の高速化手法の提案とその評価
骋笔鲍による多倍长整数乗算の高速化手法の提案とその評価
Koji Kitano
?
Za atsu-20170328
Za atsu-20170328
HCPC: 北海道大学競技プログラミングサークル
?
za atsu
Binary indexed tree
Binary indexed tree
HCPC: 北海道大学競技プログラミングサークル
?
BIT
AtCoder Regular Contest 045 解説
AtCoder Regular Contest 045 解説
AtCoder Inc.
?
AtCoder Regular Contest 045 解説
Aizu-2017: B
Aizu-2017: B
HCPC: 北海道大学競技プログラミングサークル
?
aizu 2017 b
kagamicomput201704
kagamicomput201704
swkagami
?
kagamicomput201704
kagamicomput201706
kagamicomput201706
swkagami
?
kagamicomput201706
Replace
Replace
oupc
?
kagamicomput201707
kagamicomput201707
swkagami
?
kagamicomput201707
明日使えないすごいビット演算
明日使えないすごいビット演算
京大 マイコンクラブ
?
KMCの例会講座で用いたスライドを一部編集したものです。 ビット演算を組み合わせたトリッキーな方法で様々な操作を高速に行う方法を紹介します。
AtCoder Regular Contest 049 解説
AtCoder Regular Contest 049 解説
AtCoder Inc.
?
AtCoder Regular Contest 049 解説
PRML_titech 8.1 - 8.2
PRML_titech 8.1 - 8.2
Takafumi Sakakibara
?
(in Japanese) 2015/02/03 PRML勉強会の資料です。(version 1.1)「パターン認識と機械学習」の下巻8.1章から8.2章を担当します。githubで公開していますので、誤字などがありましたらpull requestをお願いします。(https://github.com/sakabar/prml_titech_8-1_8-2)
kagamicomput201702
kagamicomput201702
swkagami
?
kagamicomput201702
kagami_comput2015_6
kagami_comput2015_6
swkagami
?
ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読
KCS Keio Computer Society
?
ゼロから作るDeepLearning 3.3~3.6章 輪読
kagamicomput201701
kagamicomput201701
swkagami
?
kagamicomput201701
kagamicomput201703
kagamicomput201703
swkagami
?
kagamicomput201703
CODE FESTIVAL 2015 予選B 解説
CODE FESTIVAL 2015 予選B 解説
AtCoder Inc.
?
CODE FESTIVAL 2015 予選B 解説
VBAで数値計算 03 数式実装パターン
VBAで数値計算 03 数式実装パターン
Katsuhiro Morishita
?
痴叠础を使って数値计算の解説を行ったスライドシリーズです。
Pyramid
Pyramid
tomerun
?
搁で颈蝉辞尘补辫(多様体学习のはなし)
搁で颈蝉辞尘补辫(多様体学习のはなし)
Kohta Ishikawa
?
Angle-Based Outlier Detection周辺の論文紹介
Angle-Based Outlier Detection周辺の論文紹介
Naotaka Yamada
?
高次元での外れ値検出は、次元の呪いにより距離ベースでの手法では性能が悪化する。 これに替わる手法としてAngle-Based Outlier Detectionがある。 今回の紹介論文ではこの手法の高速な近似解を与えるアルゴリズムを提案している。
kagamicomput201708
kagamicomput201708
swkagami
?
kagamicomput201708
kagamicomput201806
kagamicomput201806
swkagami
?
kagamicomput201806
ACPC 2017 Day3 D: 優柔不断
ACPC 2017 Day3 D: 優柔不断
HCPC: 北海道大学競技プログラミングサークル
?
2017/9/20 会津大学競技プログラミング合宿 Day3 (北大セット) D 問題 ※文字が見えない場合は、ダウンロードするかフルスクリーンにしてご覧ください
公開鍵暗号(7): データ圧縮
公開鍵暗号(7): データ圧縮
Joe Suzuki
?
実験数学3 (大阪大学理学部数学科 3年?4年) 鈴木 譲 2014年6月26日
レイトレ空间构造入门
レイトレ空间构造入门
Toru Matsuoka
?
kagamicomput201709
kagamicomput201709
swkagami
?
kagamicomput201709
エンシ?ニアに惭补肠を荐める理由
エンシ?ニアに惭补肠を荐める理由
Hiroyuki Kusu
?
贰诲颈迟辞谤缩小のススメ
贰诲颈迟辞谤缩小のススメ
Nobukazu Hanada
?
Unity Fukuoka 04のLTで発表したスライドです。登壇したスライドはちょっと編集の上アップロードをします。
More Related Content
What's hot
(20)
kagamicomput201707
kagamicomput201707
swkagami
?
kagamicomput201707
明日使えないすごいビット演算
明日使えないすごいビット演算
京大 マイコンクラブ
?
KMCの例会講座で用いたスライドを一部編集したものです。 ビット演算を組み合わせたトリッキーな方法で様々な操作を高速に行う方法を紹介します。
AtCoder Regular Contest 049 解説
AtCoder Regular Contest 049 解説
AtCoder Inc.
?
AtCoder Regular Contest 049 解説
PRML_titech 8.1 - 8.2
PRML_titech 8.1 - 8.2
Takafumi Sakakibara
?
(in Japanese) 2015/02/03 PRML勉強会の資料です。(version 1.1)「パターン認識と機械学習」の下巻8.1章から8.2章を担当します。githubで公開していますので、誤字などがありましたらpull requestをお願いします。(https://github.com/sakabar/prml_titech_8-1_8-2)
kagamicomput201702
kagamicomput201702
swkagami
?
kagamicomput201702
kagami_comput2015_6
kagami_comput2015_6
swkagami
?
ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読
KCS Keio Computer Society
?
ゼロから作るDeepLearning 3.3~3.6章 輪読
kagamicomput201701
kagamicomput201701
swkagami
?
kagamicomput201701
kagamicomput201703
kagamicomput201703
swkagami
?
kagamicomput201703
CODE FESTIVAL 2015 予選B 解説
CODE FESTIVAL 2015 予選B 解説
AtCoder Inc.
?
CODE FESTIVAL 2015 予選B 解説
VBAで数値計算 03 数式実装パターン
VBAで数値計算 03 数式実装パターン
Katsuhiro Morishita
?
痴叠础を使って数値计算の解説を行ったスライドシリーズです。
Pyramid
Pyramid
tomerun
?
搁で颈蝉辞尘补辫(多様体学习のはなし)
搁で颈蝉辞尘补辫(多様体学习のはなし)
Kohta Ishikawa
?
Angle-Based Outlier Detection周辺の論文紹介
Angle-Based Outlier Detection周辺の論文紹介
Naotaka Yamada
?
高次元での外れ値検出は、次元の呪いにより距離ベースでの手法では性能が悪化する。 これに替わる手法としてAngle-Based Outlier Detectionがある。 今回の紹介論文ではこの手法の高速な近似解を与えるアルゴリズムを提案している。
kagamicomput201708
kagamicomput201708
swkagami
?
kagamicomput201708
kagamicomput201806
kagamicomput201806
swkagami
?
kagamicomput201806
ACPC 2017 Day3 D: 優柔不断
ACPC 2017 Day3 D: 優柔不断
HCPC: 北海道大学競技プログラミングサークル
?
2017/9/20 会津大学競技プログラミング合宿 Day3 (北大セット) D 問題 ※文字が見えない場合は、ダウンロードするかフルスクリーンにしてご覧ください
公開鍵暗号(7): データ圧縮
公開鍵暗号(7): データ圧縮
Joe Suzuki
?
実験数学3 (大阪大学理学部数学科 3年?4年) 鈴木 譲 2014年6月26日
レイトレ空间构造入门
レイトレ空间构造入门
Toru Matsuoka
?
kagamicomput201709
kagamicomput201709
swkagami
?
kagamicomput201709
kagamicomput201707
kagamicomput201707
swkagami
?
明日使えないすごいビット演算
明日使えないすごいビット演算
京大 マイコンクラブ
?
AtCoder Regular Contest 049 解説
AtCoder Regular Contest 049 解説
AtCoder Inc.
?
PRML_titech 8.1 - 8.2
PRML_titech 8.1 - 8.2
Takafumi Sakakibara
?
kagamicomput201702
kagamicomput201702
swkagami
?
kagami_comput2015_6
kagami_comput2015_6
swkagami
?
ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読
KCS Keio Computer Society
?
kagamicomput201701
kagamicomput201701
swkagami
?
kagamicomput201703
kagamicomput201703
swkagami
?
CODE FESTIVAL 2015 予選B 解説
CODE FESTIVAL 2015 予選B 解説
AtCoder Inc.
?
VBAで数値計算 03 数式実装パターン
VBAで数値計算 03 数式実装パターン
Katsuhiro Morishita
?
Pyramid
Pyramid
tomerun
?
搁で颈蝉辞尘补辫(多様体学习のはなし)
搁で颈蝉辞尘补辫(多様体学习のはなし)
Kohta Ishikawa
?
Angle-Based Outlier Detection周辺の論文紹介
Angle-Based Outlier Detection周辺の論文紹介
Naotaka Yamada
?
kagamicomput201708
kagamicomput201708
swkagami
?
kagamicomput201806
kagamicomput201806
swkagami
?
ACPC 2017 Day3 D: 優柔不断
ACPC 2017 Day3 D: 優柔不断
HCPC: 北海道大学競技プログラミングサークル
?
公開鍵暗号(7): データ圧縮
公開鍵暗号(7): データ圧縮
Joe Suzuki
?
レイトレ空间构造入门
レイトレ空间构造入门
Toru Matsuoka
?
kagamicomput201709
kagamicomput201709
swkagami
?
Viewers also liked
(17)
エンシ?ニアに惭补肠を荐める理由
エンシ?ニアに惭补肠を荐める理由
Hiroyuki Kusu
?
贰诲颈迟辞谤缩小のススメ
贰诲颈迟辞谤缩小のススメ
Nobukazu Hanada
?
Unity Fukuoka 04のLTで発表したスライドです。登壇したスライドはちょっと編集の上アップロードをします。
私がお世话になった技术书たち
私がお世话になった技术书たち
法林浩之
?
2016年2月27日(土)、オープンソースカンファレンス2016 Tokyo/Springのライトニングトークで発表したときの資料です。
厂滨惭顿で整数除算
厂滨惭顿で整数除算
shobomaru
?
鲍狈滨齿ことはじめ
鲍狈滨齿ことはじめ
Tomoya Miwa
?
社内勉強会用の資料です。(公開に際し、一部修正) 「Windows CEは触ったことあるけど、UNIX何それ?」という人向けに作りました。
鲍苍颈虫コマンド入门
鲍苍颈虫コマンド入门
Satosi Sakai
?
5/8 rg 新人向け
齿别辞苍辫丑颈ハッカソンで别虫辫を作ってみた
齿别辞苍辫丑颈ハッカソンで别虫辫を作ってみた
MITSUNARI Shigeo
?
Boost.SIMD
Boost.SIMD
Akira Takahashi
?
BoostCon 2011でのJoel Falcou, Mathias Gaunardによる発表「Practical SIMD acceleration with Boost.SIMD」の日本語訳。
PFI Seminar 2010/02/18
PFI Seminar 2010/02/18
Preferred Networks
?
Unix 基礎
Unix 基礎
Sho A
?
Unixカーネルの設計 7 プロセスの制御
Unixカーネルの設計 7 プロセスの制御
Norito Agetsuma
?
Unixカーネルの設計の社内勉強会資料です。 http://www.amazon.co.jp/UNIXカーネルの設計-Maurice-J-Bach/dp/4320025512
鲍苍颈虫ファイルシステムの歴史
鲍苍颈虫ファイルシステムの歴史
magoroku Yamamoto
?
詳解UNIXプログラミング 第4章 ファイルとディレクトリ
詳解UNIXプログラミング 第4章 ファイルとディレクトリ
Takaya Kotohata
?
個人的な学習用です 間違いがあったら指摘いただけると助かります http://tkot.hatenablog.com/
百万件くらいのデータの扱い方
百万件くらいのデータの扱い方
Masafumi Yokoyama
?
件数が多いデータの扱い方について。 キーワードは『荷物運び』です。 ※いわゆるビッグデータの話ではありません(Hadoopなどは千兆単位のデータを扱う)
【幕張読書会】Unixカーネルの設計 3(バッファキャッシュ)
【幕張読書会】Unixカーネルの設計 3(バッファキャッシュ)
ktateish
?
読書会の担当部分の解説スライド 資料一覧: https://docs.google.com/spreadsheets/d/1VZMz_31Z7FQBnK139o8yMqzwrTJgZWtPqgoG-mx1zh0/edit?usp=sharing
Happy Optimization
Happy Optimization
guestee2c67
?
Unix architecture
Unix architecture
raw-hide
?
鲍狈滨齿の歴史から始まり、翱厂の基本的な机能の説明やカーネルとおしゃべりするためのシステムコールなどについての内容です!
エンシ?ニアに惭补肠を荐める理由
エンシ?ニアに惭补肠を荐める理由
Hiroyuki Kusu
?
贰诲颈迟辞谤缩小のススメ
贰诲颈迟辞谤缩小のススメ
Nobukazu Hanada
?
私がお世话になった技术书たち
私がお世话になった技术书たち
法林浩之
?
厂滨惭顿で整数除算
厂滨惭顿で整数除算
shobomaru
?
鲍狈滨齿ことはじめ
鲍狈滨齿ことはじめ
Tomoya Miwa
?
鲍苍颈虫コマンド入门
鲍苍颈虫コマンド入门
Satosi Sakai
?
齿别辞苍辫丑颈ハッカソンで别虫辫を作ってみた
齿别辞苍辫丑颈ハッカソンで别虫辫を作ってみた
MITSUNARI Shigeo
?
Boost.SIMD
Boost.SIMD
Akira Takahashi
?
PFI Seminar 2010/02/18
PFI Seminar 2010/02/18
Preferred Networks
?
Unix 基礎
Unix 基礎
Sho A
?
Unixカーネルの設計 7 プロセスの制御
Unixカーネルの設計 7 プロセスの制御
Norito Agetsuma
?
鲍苍颈虫ファイルシステムの歴史
鲍苍颈虫ファイルシステムの歴史
magoroku Yamamoto
?
詳解UNIXプログラミング 第4章 ファイルとディレクトリ
詳解UNIXプログラミング 第4章 ファイルとディレクトリ
Takaya Kotohata
?
百万件くらいのデータの扱い方
百万件くらいのデータの扱い方
Masafumi Yokoyama
?
【幕張読書会】Unixカーネルの設計 3(バッファキャッシュ)
【幕張読書会】Unixカーネルの設計 3(バッファキャッシュ)
ktateish
?
Happy Optimization
Happy Optimization
guestee2c67
?
Unix architecture
Unix architecture
raw-hide
?
Similar to 骋笔鲍による多倍长整数乗算の高速化手法の提案
(20)
颁鲍顿础1日(?)体験会
颁鲍顿础1日(?)体験会
RinKuriyama
?
追記: 日本語抜け落ちを修正したバージョンを以下のURLにアップロードしました。 https://www2.slideshare.net/RinKuriyama/cuda1-239289620 所属研究室で主催したCUDAによるGPUを用いたプログラミングチュートリアル資料。「並列計算とは」に始まり、「GPU、CUDAの構造の関係」、「ベクトル計算の並列化」、そして「神経回路計算におけるCUDAプログラミング基礎」まで。
多倍长整数の乗算と高速フーリエ変换
多倍长整数の乗算と高速フーリエ変换
京大 マイコンクラブ
?
多倍长整数の乗算を高速に行うアルゴリズムを、カラツバ法から始めて、最终的に高速フーリエ変换を用いた乗算に至るまでを解説しました。
optimal Ate pairing
optimal Ate pairing
MITSUNARI Shigeo
?
introduction of x64 assembler for implementation of optimal ate pairing
2012-03-08 MSS研究会
2012-03-08 MSS研究会
Kimikazu Kato
?
2012/03/08 電子情報通信学会システム数理と応用研究会招待講演での資料です。
An Experimental Study of Bitmap Compression vs. Inverted List Compression
An Experimental Study of Bitmap Compression vs. Inverted List Compression
Takeshi Yamamuro
?
颁鲍顿础1日(?)体験会 (再アップロード)
颁鲍顿础1日(?)体験会 (再アップロード)
RinKuriyama
?
以前アップロードした "CUDA 1日(?)体験会 https://www2.slideshare.net/RinKuriyama/cuda1" の日本語が抜け落ちていたため、修正して再アップロードしました。 所属研究室で主催したCUDAによるGPUを用いたプログラミングチュートリアル資料。「並列計算とは」に始まり、「GPU、CUDAの構造の関係」、「ベクトル計算の並列化」、そして「神経回路計算におけるCUDAプログラミング基礎」まで。
Deep learning実装の基礎と実践
Deep learning実装の基礎と実践
Seiya Tokui
?
2014年8月26日の日本神経回路学会主催セミナー「Deep Learningが拓く世界」における発表スライドです。Deep Learningの主なフレームワークで共通する設計部分と、実験の仕方について説明しています。
衝突判定
衝突判定
Moto Yan
?
大学の時に作った衝突判定についてだべった時用のスライド。 発見したのでアップしてみる。スライドの作り方がいま見るとすごく雑い。
第5回 配信講義 計算科学技術特論B(2022)
第5回 配信講義 計算科学技術特論B(2022)
RCCSRENKEI
?
第5回は、「颁笔鲍単性性能」の向上について、実际のアプリケーションで発生した性能律速要因とその改善の事例について绍介する。
More modern gpu
More modern gpu
Preferred Networks
?
GPUがなぜ速いのか,またその上でどのようなデータ構造やアルゴリズム,ライブラリが使えるのかを説明します。特にMapReduceなどの非均質で,離散的なアルゴリズムがいかに高速に実現されるかを紹介します。 実験に使ったコード https://github.com/hillbig/gpuexperiments セミナーの動画 https://www.youtube.com/watch?v=WmETPBK3MOI
第11回 配信講義 計算科学技術特論B(2022)
第11回 配信講義 計算科学技術特論B(2022)
RCCSRENKEI
?
本讲义では地震分野における大规模有限要素法シミュレーションをスーパーコンピュータ上で高速に実行するための手法について説明する。ここでは、有限要素法における厂滨惭顿やマルチコアを用いた并列计算方法、また、时间并列アルゴリズムによるさらなる高速化について説明する。
竞技プログラミングでの线型方程式系
竞技プログラミングでの线型方程式系
tmaehara
?
Hpc148
Hpc148
N.Nakasato
?
第148回贬笔颁研究会の発表スライド
第15回 配信講義 計算科学技術特論B(2022)
第15回 配信講義 計算科学技術特論B(2022)
RCCSRENKEI
?
精度保証付き数値計算入門 概要: 数値計算には丸め誤差の問題があることを前回の講義で解説した。 計算が正しいことが保証されない数値計算は数学の証明に不向きなように思われ るが、 それを可能とする精度保証付き数値計算について概要を紹介する。
研究动向から考える虫86/虫64最适化手法
研究动向から考える虫86/虫64最适化手法
Takeshi Yamamuro
?
ICDE2014 勉強会 新井担当分
ICDE2014 勉強会 新井担当分
Junya Arai
?
http://www.kde.cs.tsukuba.ac.jp/dbreading/?ICDE2014%CA%D9%B6%AF%B2%F1
0から理解するニューラルネットアーキテクチャサーチ(狈础厂)
0から理解するニューラルネットアーキテクチャサーチ(狈础厂)
MasanoriSuganuma
?
NAS for CNN
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用(高度な最適化)
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用(高度な最適化)
智啓 出川
?
長岡技術科学大学 2015年度先端GPGPUシミュレーション工学特論(全15回,大学院生対象講義) 第13回数値流体力学への応用(高度な最適化) 2015年度先端GPGPUシミュレーション工学特論 ?第1回 先端シミュレーションおよび産業界におけるGPUの役割 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180313 ?第1回補足 GROUSEの利用方法 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59180326 ?第2回 GPUによる並列計算の概念とメモリアクセス http://www.slideshare.net/ssuserf87701/2015gpgpu2-59180382 ?第3回 GPUプログラム構造の詳細(threadとwarp) http://www.slideshare.net/ssuserf87701/2015gpgpu3-59180483 ?第4回 GPUのメモリ階層の詳細(共有メモリ) http://www.slideshare.net/ssuserf87701/2015gpgpu4-59180572 ?第5回 GPUのメモリ階層の詳細(様々なメモリの利用) http://www.slideshare.net/ssuserf87701/2015gpgpu5-59180652 ?第6回 プログラムの性能評価指針(Flop/Byte,計算律速,メモリ律速) http://www.slideshare.net/ssuserf87701/2015gpgpu6-59180736 ?第7回 総和計算(Atomic演算) http://www.slideshare.net/ssuserf87701/2015gpgpu7-59180844 ?第8回 偏微分方程式の差分計算(拡散方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu8-59180918 ?第9回 偏微分方程式の差分計算(移流方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu9-59180982 ?第10回 Poisson方程式の求解(線形連立一次方程式) http://www.slideshare.net/ssuserf87701/2015gpgpu10-59181031 ?第11回 数値流体力学への応用(支配方程式,CPUプログラム) http://www.slideshare.net/ssuserf87701/2015gpgpu11-59181134 ?第12回 数値流体力学への応用(GPUへの移植) http://www.slideshare.net/ssuserf87701/2015gpgpu12-59181230 ?第13回 数値流体力学への応用(高度な最適化) http://www.slideshare.net/ssuserf87701/2015gpgpu13-59181316 ?第14回 複数GPUの利用 http://www.slideshare.net/ssuserf87701/2015gpgpu14-59181367 ?第15回 CPUとGPUの協調 http://www.slideshare.net/ssuserf87701/2015gpgpu15-59181450 2015年度GPGPU実践基礎工学 ?第1回 学際的分野における先端シミュレーション技術の歴史 http://www.slideshare.net/ssuserf87701/2015gpgpu1 2015年度GPGPU実践プログラミング ?第1回 GPGPUの歴史と応用例 http://www.slideshare.net/ssuserf87701/2015gpgpu1-59179080 講義には長岡技術科学大学のGPGPUシステム(GROUSE)を利用しています。 開発環境 CPU Intel Xeon X5670 × 32 GPU NVIDIA Tesla M2050(Fermi世代) × 64 CUDA 4.0(諸般の事情によりバージョンアップされていません) PGI Fortran 11.3
CMSI計算科学技術特論A(14) 量子化学計算の大規模化1
CMSI計算科学技術特論A(14) 量子化学計算の大規模化1
Computational Materials Science Initiative
?
2009/12/10 GPUコンピューティングの現状とスーパーコンピューティングの未来
2009/12/10 GPUコンピューティングの現状とスーパーコンピューティングの未来
Preferred Networks
?
PFI社内セミナー 2009年12月10日 20:00-21:00(予定) GPUコンピューティングの現状とスーパーコンピューティングの未来 発表者: 村主 崇行(プリファードインフラストラクチャー 研究開発部門?京都大学大学院 物理学第二教室) セミナー録画URL: http://www.ustream.tv/recorded/2837689 このスライドは、発表後にみなさまからいただいた貴重な意見をもとに改訂した版です。発表時点での版はこちら: http://www.slideshare.net/pfi/20091210-gpu-2735685
颁鲍顿础1日(?)体験会
颁鲍顿础1日(?)体験会
RinKuriyama
?
多倍长整数の乗算と高速フーリエ変换
多倍长整数の乗算と高速フーリエ変换
京大 マイコンクラブ
?
optimal Ate pairing
optimal Ate pairing
MITSUNARI Shigeo
?
2012-03-08 MSS研究会
2012-03-08 MSS研究会
Kimikazu Kato
?
An Experimental Study of Bitmap Compression vs. Inverted List Compression
An Experimental Study of Bitmap Compression vs. Inverted List Compression
Takeshi Yamamuro
?
颁鲍顿础1日(?)体験会 (再アップロード)
颁鲍顿础1日(?)体験会 (再アップロード)
RinKuriyama
?
Deep learning実装の基礎と実践
Deep learning実装の基礎と実践
Seiya Tokui
?
衝突判定
衝突判定
Moto Yan
?
第5回 配信講義 計算科学技術特論B(2022)
第5回 配信講義 計算科学技術特論B(2022)
RCCSRENKEI
?
More modern gpu
More modern gpu
Preferred Networks
?
第11回 配信講義 計算科学技術特論B(2022)
第11回 配信講義 計算科学技術特論B(2022)
RCCSRENKEI
?
竞技プログラミングでの线型方程式系
竞技プログラミングでの线型方程式系
tmaehara
?
Hpc148
Hpc148
N.Nakasato
?
第15回 配信講義 計算科学技術特論B(2022)
第15回 配信講義 計算科学技術特論B(2022)
RCCSRENKEI
?
研究动向から考える虫86/虫64最适化手法
研究动向から考える虫86/虫64最适化手法
Takeshi Yamamuro
?
ICDE2014 勉強会 新井担当分
ICDE2014 勉強会 新井担当分
Junya Arai
?
0から理解するニューラルネットアーキテクチャサーチ(狈础厂)
0から理解するニューラルネットアーキテクチャサーチ(狈础厂)
MasanoriSuganuma
?
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用(高度な最適化)
2015年度先端GPGPUシミュレーション工学特論 第13回 数値流体力学への応用(高度な最適化)
智啓 出川
?
CMSI計算科学技術特論A(14) 量子化学計算の大規模化1
CMSI計算科学技術特論A(14) 量子化学計算の大規模化1
Computational Materials Science Initiative
?
2009/12/10 GPUコンピューティングの現状とスーパーコンピューティングの未来
2009/12/10 GPUコンピューティングの現状とスーパーコンピューティングの未来
Preferred Networks
?
骋笔鲍による多倍长整数乗算の高速化手法の提案
1.
理学部 情報数理科学科 4回生
藤本研究室所属 北野晃司
2.
?
現在主流の整数型 ? int(32bit) ? long long(64bit) ? 多倍長整数演算 ? より大きいbit数の整数を対象とした演算 ? 研究が盛ん ? GPGPU ? GPUによる汎用計算 ? 近年注目されつつある 2 Next?動機?目的
3.
?
多倍長整数演算は時間がかかる ? 特に積、商、平方根の演算 ? 商、平方根 ? ニュートン法を用いて高速化可能 ? 高速な乗算が使える場合 ? GPUを用いて多倍長整数乗算を高速に解く手法を提 案 ※ニュートン法による逆数を求める漸化式?Xn+1=2*Xn-a*Xn^2 平方根を求める漸化式?Xn+1=(Xn + a/Xn) /2 aは適当な初期 値 3 Next?提案内容
4.
?
積表という並列処理に適した データ構造とその処理法の提案 ? 2つの多倍長整数の和を高速に求める アルゴリズムの提案 時間の都合により割 愛 4 Next?発表の流れ
5.
?
GPUによる並列処理の概要 ? 提案手法 ? 積表 ? 積表に対する効率的な処理法の提案 ? 評価実験 ? まとめと今後の課題 5
6.
?
スレッド ― GPUによる並列処理の 最小単位 ? スレッドブロック ? スレッドの集まり スレッ スレッドブロッ ク ド (以下ブロッ ク) 6 Next?GPUプログラムの概要
7.
?
1つの関数を複数のブロック 関数 により同時に処理可能 ? ? 右図のように同一のコードを参 ? ? 照 A[ID]=A[ID]*2+1 ? スレッドのID ? ? どのブロックのどのスレッドな ? ? のかを表す番号 ? 異なるスレッドに異なる動作を させる鍵 7 Next?提案手法
8.
?
GPUによる並列処理の概要 ? 提案手法 ? 積表 ? 積表に対する効率的な処理法の提案 ? 評価実験 ? まとめと今後の課題 8
9.
?
10進数における積 ? 右図のような筆算で求めることが可 ? 積表能 ?–桁上げの処理が必要 筆算を元に得られた表 – 桁上げの計算をその値が必要な 桁上げが無ければ列(桁)ごと 列自身に行わせる に並列に計算できるので – 列ごとの総和が他の列の演算と は????? は独立に行える 9 Next?積表の構成
10.
?
多倍長整数A×Bの積表 ? Aは5桁、Bは3桁 ? BASEは多倍長整数の基数 ? BASE=10なら10進数 ? A[0]がAの1の位の数 ~~~~~~~~~~~~~~~~~~~ ? 要素の規則性 ? 2行ごとに添字が1変わる ? 桁数を変えても同様 10 Next?積表の一般化
11.
?
多倍長整数A×Bの積表 ? Aはa桁、Bはb桁(a≧b) ? 赤と緑の部分 ? 列数は共にb列 ? 行数は1列毎に2行ずつ増減 ? 黄の部分 ? 列数はa-b列 ? 行数はb×2行 11 Next?積表の単純な処理法
12.
?
積表の処理 ? 1列に1スレッドの割り当て ? 列ごとの総和計算 ? この処理の欠点 ? スレッド毎の演算回数の差 ? 処理が早く終わったスレッド はただ待つだけ ? 演算器が遊んでフルに性能が 発揮できない 12 Next?積表の再構成
13.
?
欠点を解決するための変形 ? 緑の部分を赤の部分に結合 ? 列数は(a-b)+b=a列 ? 行数はb×2行 13 Next?再構成した積表の具体
14.
?
5桁×3桁での例 ? 赤と緑、黄、の2種類の長方形 ? 列総和に必要な演算回数 – どの列も同じ(2×b 回) ? 赤と緑の長方形 – 赤の総和と緑の総和が個別に必要なことに注意 14 Next?さらなる工夫
15.
?
GPUによる並列処理の概要 ? 提案手法 ? 積表 ? 積表に対する効率的な処理法の提案 ? 評価実験 ? まとめと今後の課題 15
16.
?
水色の領域 ? 赤のみを含む?緑のみを 含む?境界を含むの3種類 ? 1ブロックが1領域を担当 ※BLOCK_SIZE=1ブロック中のスレッド数 16 Next?領域分けによる利点
17.
512列
b列 ? GPU GTX480では 例え ? 最大23040スレッド並列 ば??? ? 1 これは並列性の低い手法 b× 0 ? 2 2 512スレッド並 ? 4 行 行 列 ? 領域分けは並列性を高める Aは1024桁 Bは512桁とな る 例:BLOCK_SIZE=16な ら 17 16384スレッド並列 Next?具体的な処理法
18.
?
赤のみもしくは緑のみの領域 ? ? 各スレッドが自分が計算すべき列 ? colにおける領域内での総和計算 ? ? 境界を含む領域 ? 赤と緑の部分それぞれの総和計算 ? ? ? 赤の部分の総和 ? ? 答えを格納する配列Cの添字colへ 足し込む ? 緑の部分の総和 C ?? ?? ? ? ? ? ? 配列Cの添字col+a(Aの桁数)へ ? 足し込む 18 Next?黄の長方形に対する処理
19.
?
先と同様に領域分け ? 赤のみ(緑のみ)に対する処理 と同様 ? それらとの違い ? 参照するAやBの添字 ? 総和を足し込むCの添字 19 Next?評価実験
20.
?
GPUによる並列処理の概要 ? 提案手法 ? 積表 ? 積表に対する効率的な処理法の提案 ? 評価実験 ? まとめと今後の課題 20
21.
?
NTL(A Library for doing Number Theory) ? CPUによる多倍長演算ライブラリ ? 本実験の比較対象 ? 出典:http://www.shoup.net/ntl/ ? NTLと提案するアルゴリズムの比較 ? 6種類のbit数において36通りの組み合わせの 多倍長整数乗算の実行時間 21 Next?実験環境
22.
?
CPU ? 2.93GHz Intel Core i3(1コアのみ使用,SSE命令未使 用) ? GPU ? NVIDIA GeForce GTX480 ? OS ? 64bit Windows7 Professional SP1 ? コンパイラ ? Visual Studio 2008 Professional ? CUDA ? Ver 3.2 ? ディスプレイドライバ ? Ver 285.62 22 Next?実験結果
23.
? 多倍長整数積A×Bの計算時間 ? 単位はミリ秒 ※左は今回実装したアルゴリズム、右はNTLによる結果
参考:256Kbits=262144bits≒10進数80 23 Next?NTLに対する速度向上率
24.
?
下表はNTLに対する、実装したアルゴリズムの速度向上 率 ? 実験したすべての場合において実装したアルゴリズムは NTLを上回る速度 ? 最大で60倍を超える速度向上率 24 Next?まとめと今後の課題
25.
?
GPUによる並列処理の概要 ? 提案手法 ? 積表 ? 積表に対する効率的な処理法の提案 ? 評価実験 ? まとめと今後の課題 25
26.
?
実装したアルゴリズムは既存の多倍長演算 ライブラリを上回る速度 ? 今回は最大256Kbitsという相当大きい数までを想定 ? 実際の問題では数Kbits程度が主流 ? 対象を絞ることでさらなる高速化手法が考えられる可能性大 26
Download