狠狠撸

狠狠撸Share a Scribd company logo
マイクロビデオに付与するBGMの
推薦に関する基礎研究
A Study of Background Music Recommendation
for Micro Video
北海道大学 工学部
情報エレクトロニクス学科 情報工学コース
複雑系工学講座 調和系工学研究室
学部4年 細川皓平
卒業論文発表
研究背景?目的
簡易にマイクロビデオに対するBGMを選択?決定するための支援
背景
SNSでの動画共有の普及 個人での動画制作が身近に
音楽をつけて動画を編集したいというニーズ
動画として vine Youtube など
本研究では、vine に BGM を付けることに着目
●
膨大な曲の中から選曲するのは大変
●
音楽の知識が必要
vineとは
● スマートフォン + SNS、より手軽に撮影?公開
●
最長6秒のマイクロビデオ
編集作業として BGM、効果音、トリミングなどがある
課題
目的
デモ
まずは作成したシステムをご覧ください。
研究全体像
マイクロビデオ (mp4) BGM (AAC)
ffmpegなどの編集ツール
IN IN
Web,ライブラリ
膨大な音楽
マイクロビデオに対するBGMの選択?決定の支援
BGMの提示
BGM選択?決定
①BGMの類似度による提示 ②ランダムなBGMの提示
①、②で比較、評価実験を行う。
BGM提示方法 : ノックアウト方式
提示するBGM : 音楽の類似度で決定
DB
目的
従来のBGM付与
BGM付与選択支援システム
評価実験
今回の提案
ノックアウト方式によるBGMの提示
A
A
A'
B
A'
A''
A'' で製作者が決定したら終了
二者択一で選択する
選択したBGMに類似したBGMが
次の候補として提示される
Aに類似したBGM
A’に類似したBGM
アイディア
選択されたBGMに類似したBGMは
嗜好に合っている(内容ベース推薦)
tempo
テンポ,つまり曲の早さを表す.
attack time
音が鳴り始めてからピークまで
(アタックフェイズ)の時間
attack slope
アタックフェイズにおける傾き
attack leap
アタックフェイズにおける振幅の大きさ
decrease slope
音のピークからの減衰率
brightness
きらびやかさ
roll off
全体の85%の位置の周波数
zerocross
noisiness(騒々しさ)を求める
Roughness
荒々しさ
centroid
周波数スペクトルの平均
spread
周波数スペクトルの分散
skewness
周波数スペクトルの歪度
kurtosis
周波数スペクトルの尖度
flatness
周波数スペクトルの分布の平坦さ
irregularity
周波数スペクトルの連続するピークの変化率
inharmonicity
倍音の割合
entropy
入力された波形のエントロピー
Chromagram (12次元)
12音階ごとの分布
MIRtoolbox:MATLABのプラグイン
音楽の類似度によるBGMの提示
特徴量の抽出として: 28次元
1. 特徴量を標準化
  [0,1]に変換
Dij=∑
n=1
28
|min?m jn|
2. 特徴量28次元から
  マンハッタン距離を算出
  (非類似度と呼ぶ)
3. 類似度ですぐに収束することを避け
るため  タブーリストの導入
タブーリストの役割
一度提示したBGMは再び提示しな
いというルールに基づく
評価実験の方法
類似度に従ってBGMを提示する方法 (提案手法)Ma 
Ra  ランダムにBGMを提示する方法
2手法の比較を行う
BA
A A’
Aに類似したBGMを提示
BA
A C
ランダムに提示
Ma Ra
異なるマイクロビデオに対して 被験者12人×10試行 実験 1. Ma(類似度)→ 5試行
2. Ra(ランダム)→ 5試行
BGMは100種類を用意する
10試行の中から、マイクロビデオとBGMが合っているものを5つ選択する 
出力: 12人×5票 = 60票のデータを分析する
結果とBGMの選択の推移
Ma(類似度による提示)と
Ra(ランダムな提示)の
比較結果
MaのほうがRaより評価が低かった
 (Ma=29, Ra=31)
結果
類似度を考慮したBGM提示 ランダムによるBGM提示
: 推薦された音楽
: それ以外の音楽
矢印はBGM選択の
推移を表す
①類似度によって提示するBGMの決定方法に課題がある
②類似度の算出方法であるマンハッタン距離が妥当かどうか議論されていない
考察
Ma Ra
選択の推移
多次元尺度構成法を用いてプロット
本研究のまとめ
BGMの類似度による提示方法(Ma)と、ランダムな提示方法(Ra)を比
較して、ランダムな提示方法が若干よい結果が得られた
本研究では、vineに BGMを付けることに着目し
簡易にマイクロビデオに対するBGMを選択?決定するための
BGM付与選択支援ツールを作成した
BGMの提示方法は、ノックアウト方式として
提示するBGMは、マンハッタン距離を用いた類似度により決定した
補足:提示するBGMの類似度の分布
マンハッタン距離に基づいてプロット (古典的多次元尺度構成法: Classical MDS)
音楽のジャンルごとに色分けした

More Related Content

More from harmonylab (20)

【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
harmonylab
?
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
harmonylab
?
【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究
【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究
【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究
harmonylab
?
【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究
【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究
【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究
harmonylab
?
【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究
【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究
【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究
harmonylab
?
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
harmonylab
?
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
harmonylab
?
【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究
【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究 【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究
【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究
harmonylab
?
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
harmonylab
?
【DLゼミ】Generative Image Dynamics, CVPR2024
【DLゼミ】Generative Image Dynamics, CVPR2024【DLゼミ】Generative Image Dynamics, CVPR2024
【DLゼミ】Generative Image Dynamics, CVPR2024
harmonylab
?
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
harmonylab
?
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language ModelsGenerating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
harmonylab
?
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
?
【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也
【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也
【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也
harmonylab
?
【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究
【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究
【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究
harmonylab
?
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
harmonylab
?
【卒业论文】印象タグを用いた衣服画像生成システムに関する研究
【卒业论文】印象タグを用いた衣服画像生成システムに関する研究【卒业论文】印象タグを用いた衣服画像生成システムに関する研究
【卒业论文】印象タグを用いた衣服画像生成システムに関する研究
harmonylab
?
【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究
【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究
【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究
harmonylab
?
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
?
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
?
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
【卒业论文】尝尝惭を用いた惭耻濒迟颈-础驳别苍迟-顿别产补迟别における反论の効果に関する研究
harmonylab
?
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
【卒业论文】深层学习によるログ异常検知モデルを用いたサイバー攻撃検知に関する研究
harmonylab
?
【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究
【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究
【卒业论文】尝尝惭を用いたエージェントの相互作用による俳句の生成と评価に関する研究
harmonylab
?
【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究
【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究
【修士论文】帝国议会および国会议事速记録における可能表现の长期的変迁に関する研究
harmonylab
?
【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究
【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究
【修士论文】竞轮における注目レース选定と尝尝惭を用いたレース绍介记事生成に関する研究
harmonylab
?
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
harmonylab
?
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
harmonylab
?
【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究
【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究 【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究
【修士论文】尝尝惭を用いた俳句推敲と批评文生成に関する研究
harmonylab
?
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
harmonylab
?
【DLゼミ】Generative Image Dynamics, CVPR2024
【DLゼミ】Generative Image Dynamics, CVPR2024【DLゼミ】Generative Image Dynamics, CVPR2024
【DLゼミ】Generative Image Dynamics, CVPR2024
harmonylab
?
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
harmonylab
?
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language ModelsGenerating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
harmonylab
?
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
?
【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也
【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也
【修士论文】代替出勤者の选定业务における依頼顺决定方法に関する研究   千坂知也
harmonylab
?
【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究
【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究
【修士论文】経路探索のための媒介中心性に基づく道路ネットワーク阶层化手法に関する研究
harmonylab
?
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
harmonylab
?
【卒业论文】印象タグを用いた衣服画像生成システムに関する研究
【卒业论文】印象タグを用いた衣服画像生成システムに関する研究【卒业论文】印象タグを用いた衣服画像生成システムに関する研究
【卒业论文】印象タグを用いた衣服画像生成システムに関する研究
harmonylab
?
【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究
【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究
【卒业论文】大规模言语モデルを用いたマニュアル文章修正手法に関する研究
harmonylab
?
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
?
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
?

hosokawa b