Pika vs Midjourney 動画生成機能:50回以上の生成で比較した実践レポート
この2週間、PikaとMidjourneyの動画生成機能を徹底的にテストしてきました。Twitterで見かけるキレイなデモ動画ではなく、実際の試行錯誤を伴うプロンプト——ネオンの街をスケートボードで走る猫、花に変身する女性、崩れゆく城のタイムラプス——をひたすら生成し続けました。クレジットを消費し、パラメータを調整し、ローディングスピナーを目が霞むほど見つめました。以下が実際に体験した内容です。
クイック比較表
| 機能 | Pika | Midjourney(動画) |
|---|---|---|
| モーション品質 | 流動的、物理演算対応、ただし時にゴムのように伸びる | 硬直、スライドショー的な遷移が多い |
| プロンプト追従性 | 物体は高い、複雑なシーンは低い | 全体的に低い、ただしスタイルの一貫性は良好 |
| 制御オプション | テキスト→動画、画像→動画、動画→動画、カメラワーク、ネガティブプロンプト | テキスト→動画のみ(現時点)、カメラ制御なし |
| 生成速度 | 3秒クリップあたり30~60秒 | 4秒クリップあたり2~4分 |
| 解像度 | 1080p(720pからアップスケール) | 720p(アップスケール不可) |
| スタイルの柔軟性 | カートゥーン、写実的、アニメ、3D、クレイアニメ | 強力なデフォルト「Midjourney美学」(絵画的、ソフト) |
| 料金 | 無料枠(1日10クレジット)、有料は月額$10~ | 月額$10で200生成 |
| 動画長 | 最大4秒(無料)、8秒(有料) | 4秒固定 |
| 反復のしやすさ | 簡単:プロンプト変更、再試行、シード調整 | 困難:最初から再生成が必要 |
機能別比較
第1ラウンド:基本動作と物理演算
最もシンプルなテストから始めました:「大理石の階段を跳ねる赤いボール」
Pikaは初回で驚くほど上手く処理しました。ボールの軌跡は重力に従い——高さを減らしながら跳ね、自然に回転し、ソフトな影まで落としていました。大理石の階段は磨かれた石のように見えましたが、ボールの素材はややプラスチックっぽかったです。5回バリエーションを生成したところ、3回はボールが最後の段から転がり落ち、1回は途中でテレポートし、1回は階段にめり込みました。平均品質:7/10。
Midjourneyは美しい静止画——跳ねる途中のボールのある階段——を生成しました。そして「動画」は、ボールがバグったGIFのように上下に震える4秒ループでした。前進動作なし。回転なし。階段の質感は見事でした——フェルメールの絵画のよう——しかし動きはお話になりませんでした。「連続動作、階段を転がるボール」と再プロンプトしましたが、ボールがホッケーパックのように硬直して滑るだけでした。平均品質:2/10。
判定:Pikaの圧勝。Midjourneyのモーションエンジンは後付け感があり、Pikaは実際に物理演算をシミュレートしています。
第2ラウンド:キャラクターアニメーションと表現力
「そばかすのある若い女性、微笑み、ゆっくりと悲しそうな表情に変わり、目に涙が浮かぶ」 というプロンプトでテスト。顔の一貫性、感情の幅、時間経過による変化を検証します。
Pika初回:女性の顔が微妙に変化——眉が下がり、唇が震え、左頬を涙が一粒伝いました。しかし途中で髪の色が茶色から赤銅色に変化。2回目:同じ涙でしたが、左目が不自然にピクピク。3回目:微笑んだ後、笑顔が固まり、目が潤む——不気味の谷。そばかすは全クリップで一貫していました。最良クリップ:6/10。
Midjourney初回:見事なポートレート——ソフトな照明、完璧なそばかす、表情豊かな目。動画:表情は変わらないが、背景が微妙にぼけたり戻ったりする4秒ループ。涙なし。変化なし。2回目:同じループだが、背景の色がわずかに変化。3回目:諦めました。キャラクターは一切動きません。Midjourneyの動画は、本質的に環境がわずかに動く静止画です。最良クリップ:1/10。
判定:またもPikaの勝利。ただし両者に重大な問題あり。Midjourneyはキャラクターの動きがまったくできません。Pikaは可能ですが、アーティファクトが発生します。
第3ラウンド:複雑なシーンと物体の相互作用
大掛かりなプロンプト:「夜のサイバーパンクマーケット、ネオンサインが点滅、空飛ぶ車が麺屋台に衝突、麺が飛び散る」
Pikaの出力:ネオンサインはリアルに点滅。空飛ぶ車は右から出現し、建物をすり抜け(ゲーム的)、屋台に衝突。麺は満足のいく弧を描いて飛び——地面に落ちるものもあれば、看板に付着するものも。屋台の店主は走って逃げました(スムーズに)。しかし車の物理演算は不正確:衝突後、ゴムボールのように跳ねました。また、ネオンサインの中国語文字は意味不明(AIに共通の問題)。総合:アクション8/10、リアリティ5/10。
Midjourneyの出力:美しいサイバーパンクマーケットの静止画——ネオンピンクとシアン、雨に濡れた通り。動画:ネオンサインは点滅(はい、それは機能しました)、雨は斜めの筋になって降りました。しかし車は空中で停止し、麺屋台は無傷。衝突なし。麺なし。「動画」は、雨のアニメーションが付いた静止シーンの4秒ループ。30分間プロンプトを変えて試しました。最良の結果:車が5センチ動いただけ。1/10。
判定:動的なシーンにはPikaだけが選択肢。Midjourneyは複数の相互作用する物体を処理できません。
第4ラウンド:スタイルの一貫性と美的品質
「油絵風、劇的な照明、嵐の海の海賊船」 というプロンプトでテスト。
Pikaは適度な動きのある船を出力——波に揺れ、帆がはためき、稲妻が光りました。しかしスタイルに一貫性がなく:船は3Dレンダリング、海は半写実的、稲妻はカートゥーン的な輝き。「油絵風」の要素は失われ、色味は濁っていました。総合:スタイル4/10。
Midjourneyは息をのむような静止画を出力——レンブラント照明、インパスト技法、豊かな青と金。動画:船は極めて穏やかに揺れ(かろうじて認識できる程度)、波はスローモーションで動き、稲妻が雲の上で明滅しました。動的ではありませんでしたが、美的品質は一貫性があり美しい。生きた絵画のようでした。スタイル8/10、モーション2/10。
判定:純粋な美的品質ではMidjourneyの勝利。最小限の動きで美しい絵画的な動画ループを求めるなら、他に類を見ません。Pikaのスタイルは一貫性がありません。
第5ラウンド:制御性と反復速度
出力をどれだけ素早く洗練できるかをテスト。同じプロンプトを使用:「シルクハットをかぶった猫、綱渡り、下の群衆が息をのむ」
Pika:初回生成は45秒。猫にシルクハットなし——「no hat」とネガティブプロンプトで修正(皮肉)。2回目:大きすぎるシルクハット。プロンプトを「小さなシルクハット、猫の耳が見える」に変更。3回目:完璧な帽子だが、猫が人間のように歩く。「猫が自然に歩く」を追加。4回目:まあまあだが、群衆が静止。群衆のラフスケッチで画像→動画を使用。5回目:成功。総時間:10分。完全な制御。
Midjourney:初回生成は3分。猫は美しくレンダリングされたが、静止。綱なし、群衆なし、歩行なし。「猫が歩くように」と試す——同じ結果。「群衆を追加」——背景は変わったが人物なし。「綱」——綱は現れたが猫は使わず。6回試行(20分)の後、猫の尾が一度だけ振れるクリップを得ました。それだけ。反復は不可能——異なる静止画像にマイナーなアニメーションが付いただけ。
判定:Pikaの圧倒的な制御性と反復速度。Midjourneyはレバーの少ないブラックボックス。
長所と短所
Pika
長所:
- リアルな物理演算(重力、衝突、流体力学)
- 複数の生成モード(テキスト、画像、動画→動画)
- カメラ制御(パン、ズーム、回転)
- ネガティブプロンプトが効果的
- 高速生成(1分未満)
- 複雑なシーン変化に対応
- 活発なコミュニティと頻繁なアップデート
短所:
- スタイルの一貫性がない——安っぽい3Dゲームのように見えることが多い
- キャラクターにモーフィングアーティファクト(髪色、顔の形状の変化)
- 解像度アップスケールは擬似的(細部が依然としてソフト)
- 無料枠が非常に限定的(1日10クレジット)
- オブジェクトのめり込みが頻発
- ネイティブ4Kアップスケールなし
Midjourney(動画)
長所:
- 見事な美的品質——絵画的、統一感、美しい照明
- フレーム間のスタイル一貫性に優れる
- アンビエントループや雰囲気ショットに最適
- キャラクターのドリフトなし(キャラクターが動かないため)
- 静的シーンの学習曲線が低い
- Midjourneyの画像生成エコシステムと統合
短所:
- ほぼ実際の動きがない——キャラクターは凍結
- アクションや物理ベースのシーンを生成できない
- カメラ制御やネガティブプロンプトなし
- 非常に遅い生成(2~4分)
- 画像→動画や動画→動画なし
- 得られるものに対して高価(月額$10で200クリップ)
- ベータ機能感が強く、完成品ではない
最終判定
実際の動画——動き、物理演算、キャラクターアクション、動的シーン——を求めるなら、Pikaが明らかな勝者です。完璧ではありません。スタイルの一貫性がなく、アーティファクトも見られます。しかし、ストーリーテリング、ミーム、短いアニメーション、コンセプト可視化に実用的です。私はすでにPikaを使って30秒のミュージックビデオ(8クリップをつなぎ合わせ)を作成し、Redditで好意的なフィードバックを得ました。Midjourneyではそれは不可能でした。
美しく絵画的なループ——ハリー・ポッターの動く肖像画や、ビデオゲームのアンビエント背景——を求めるなら、Midjourneyが優れています。しかし正直に言いましょう:あなたは動画を作っているのではなく、手間のかかるアニメーションGIFを作っているのです。月額$10なら、実際の動きが得られるPikaの有料プランを使う方が良いでしょう。
私のアドバイス:アクション、キャラクターの動き、ストーリーテリングが必要なプロジェクトではPikaから始めてください。特定の美的品質が必要な非常に短くスローなループにのみMidjourneyを使用してください。そして両方に注目し続けてください——この分野は毎週進化しています。
勝者:Pika(美的欠点はあるものの、モーションで圧倒的勝利)