Waymo の安全性への影響
道路をより安全な場所に
コミュニティにサービスを提供するうえで、そこでの信頼と安全は非常に重要です。そのため、私たちは安全性に関するデータを積極的に共有しています。__これまでのデータから、現在サービスを提供している地域では、Waymo Driver により道路がより安全になっていることが判明しています。__具体的には、負傷、エアバッグの作動、警察への届け出につながる衝突を回避する能力は、以下のデータが示すように Waymo Driver が人間を上回っています。このハブでは、Waymo Driver の無人運転(RO)時の衝突率を、人間が運転する車の一般道における衝突率のベンチマークと比較しています。安全性影響分析のベスト プラクティスを採用し、Waymo の安全に関する資料を引用することで、自律走行業界では前例のないレベルの透明性を実現しました。データと手法を共有することで、安全性への影響を測定するための取り組みを社外にも広めて促進することが目的です。このウェブページに表示されているデータは、NHTSA の一般命令(SGO)の報告スケジュールに沿って、定期的に更新されます。**
Waymo Driver と人間の比較
無人運転(RO)の走行距離
2024 年 12 月までに、Waymo は無人運転で 5,000 万マイルを走行
Waymo Driver の実走行の距離は、数千万マイルにおよびます。以下のダッシュボードには、配車サービス Waymo One が提供されている都市における、無人運転の走行距離が示されています。
地域 | 2024 年 12 月までの無人運転距離(マイル) |
|---|---|
ロサンゼルス | 37.857M |
サンフランシスコ | 53.52M |
フェニックス | 68.613M |
オースティン | 10.722M |
Waymo Driver と人間のベンチマークの比較
この表には、サービス提供地域で同じ距離を運転した場合に、人間の運転者の平均的なベンチマーク衝突率と比べて、Waymo がどの程度自動運転時の衝突(過失の有無によらず)を削減したかが示されています。減少値は、フェニックスとサンフランシスコを合わせた値と、それぞれの地域の値を示しています。結果は最も近い整数に四捨五入されています。ロサンゼルスとオースティンにおける比較は、Waymo の走行距離が十分ではなく、結果にまだ統計的有意性が認められないため、ここには記載されていません。ロサンゼルスにおけるベンチマークとの比較については、ダウンロード セクションを参照してください。
Compared to an average human driver over the same distance in our operating cities, the Waymo Driver had
フェニックスとサンフランシスコで 5,000 万マイル以上走行した、平均的な人間の運転手と Waymo Driver の比較
92% 重傷以上の結果を伴う衝突の減少率 (35 減少)
83% エアバッグの作動を伴う衝突の減少率 (230 減少)
82% 負傷を伴う衝突の減少 (544 減少)
交通弱者の負傷を伴う衝突事故の減少
92% 負傷を伴う歩行者との衝突事故の減少 (62 減少)
85% 負傷を伴う自転車との衝突事故の減少 (39 減少)
81% 負傷を伴うバイク事故の減少 (25 減少)
Waymo Driver と人間のベンチマークの比較
エアバッグ作動、負傷発生、警察への届け出あり
下のグラフは、Waymo と人間の運転手がサービス提供地域で同じ距離を走行した場合に、人間のベンチマーク衝突率と比べて、Waymo の 100 万マイル当たりの事故(衝突)数(IPMM)がどれほど減少したかを示しています。エラーバーは、IPMM 推定値の 95% 信頼区間を示しています。減少値は、フェニックスとサンフランシスコを合わせた値と、それぞれの地域の値を示しています。ロサンゼルスとオースティンにおける比較は、Waymo の走行距離が十分ではなく、結果にまだ統計的有意性が認められないため、ここには記載されていません。ロサンゼルスにおけるベンチマークとの比較については、ダウンロード セクションを参照してください。
警察に届け出られた衝突率
| Location | 100 万マイル当たりの事故数(IPMM), Waymo | 100 万マイル当たりの事故数(IPMM), Benchmark |
|---|---|---|
| All Locations | 0.02 | 0.22 |
| Phoenix | 0.01 | 0.10 |
| San Francisco | 0.04 | 0.43 |
| Los Angeles | 0.00 | 0.15 |
| Austin | 0.00 | 0.18 |
負傷を伴う衝突率
| Location | 100 万マイル当たりの事故数(IPMM), Waymo | 100 万マイル当たりの事故数(IPMM), Benchmark |
|---|---|---|
| All Locations | 0.71 | 3.90 |
| Phoenix | 0.58 | 1.98 |
| San Francisco | 0.77 | 7.47 |
| Los Angeles | 0.90 | 2.50 |
| Austin | 0.65 | 3.34 |
エアバッグの作動を伴う衝突率
| Location | 100 万マイル当たりの事故数(IPMM), Waymo | 100 万マイル当たりの事故数(IPMM), Benchmark |
|---|---|---|
| All Locations | 0.28 | 1.63 |
| Phoenix | 0.28 | 1.35 |
| San Francisco | 0.32 | 2.11 |
| Los Angeles | 0.21 | 1.23 |
| Austin | 0.37 | 2.37 |
Waymo 車両のエアバッグ作動を伴う衝突率
| Location | 100 万マイル当たりの事故数(IPMM), Waymo | 100 万マイル当たりの事故数(IPMM), Benchmark |
|---|---|---|
| All Locations | 0.05 | 1.12 |
| Phoenix | 0.06 | 0.94 |
| San Francisco | 0.06 | 1.29 |
| Los Angeles | 0.00 | 1.00 |
| Austin | 0.09 | 2.00 |
Waymo Driver と人間のベンチマークの比較
衝突率の差異(%)
下のグラフは、Waymo の衝突率と人間のベンチマーク衝突率の差異(%)を地域別に示しています(95% 信頼区間)。負の値は、Waymo Driver による衝突率が、人間の運転による衝突率よりも低いということです。0% をまたがない信頼区間は、その差異に統計的有意性が認められることを意味します。この割合の減少と信頼区間によって、Waymo Driver のエアバッグの作動、負傷、警察への届け出を伴う衝突の発生率が、人間のベンチマークと比べて、統計的有意性が認められるほど大幅に低いことが示されました。ロサンゼルスとオースティンにおける比較は、Waymo の走行距離が十分ではなく、結果にまだ統計的有意性が認められないため、ここには記載されていません。ロサンゼルスにおけるベンチマークとの比較については、ダウンロード セクションを参照してください。
Waymo 衝突率のベンチマークとの差分
| Location | ベンチマークとの差分(%), Airbag Deployment in Any Vehicle | ベンチマークとの差分(%), Airbag Deployment in Waymo Vehicle | ベンチマークとの差分(%), Any Injury Reported | ベンチマークとの差分(%), Serious Injury or Worse |
|---|---|---|---|---|
| All Locations | -82.72% | -95.69% | -81.69% | -92.11% |
| Phoenix | -79.51% | -93.82% | -70.61% | -86.11% |
| San Francisco | -84.97% | -95.14% | -89.74% | -91.36% |
| Los Angeles | -82.80% | -100.00% | -64.03% | -100.00% |
| Austin | -84.26% | -95.33% | -80.45% | -100.00% |
Waymo Driver の衝突事故のうち、速度変化が 1 マイル/時未満の割合
(デルタ V が 1 マイル/時未満)
デルタ V は、衝突時の速度の変化を表します。車対車の衝突における重大さや負傷リスクを予測する際に利用される、重要な指標の一つです。このグラフは、SGO に報告された衝突のうち、Waymo 側または相手側車両における最大デルタ V が 1 マイル/時未満(つまり、衝突によって発生した速度の変化が 1 マイル/時未満)であるものの割合を示しています。デルタ V が 1 マイル/時未満であれば、たいていの場合は軽微な損傷(へこみや傷)で済みます。このグラフには、車対車の衝突や車両単独の衝突は含まれていますが、歩行者や自転車、オートバイとの衝突は含まれていません。デルタ V は、Waymo の車両に搭載されたセンサー システムで計測された値を入力値とし、インパルス モーメント衝突モデルを使用して推定されます。注: デルタ V が 1 マイル/時未満の衝突における人間のベンチマークとの比較は、現時点では高い確度で推定することはできません。
速度変化が 1 マイル/時未満(デルタ V が 1 マイル/時未満)の SGO 衝突(%)
| Location | デルタ V が 1 マイル/時未満の衝突(%) |
|---|---|
| ALL AREAS | 43% |
| SF | 45% |
| PHX | 40% |
| LA | 42% |
| ATX | 43% |
Waymo Driver と人間運転者のベンチマークの比較(衝突事故の種類別)
これらのグラフは、サービス提供地域で同じ距離を運転した場合に、平均的なベンチマーク衝突率の人間の運転者と比べて、Waymo がどの程度乗客のみ(RO)走行での衝突事故(どちらに過失があるかによらず)を削減したかが示されています。衝突事故は 11 種類の衝突事故タイプのいずれかに分類され、すべてのサービス提供地域を対象にしています。データは、[ダウンロード セクション](https://waymo.com/safety/impact#downloads)で都市別にダウンロードできます。
数値のパーセント差を示すバーは、統計的に有意です。
いずれかの車両でエアバッグが作動した衝突事故
| Crash Type Group | Events (Benchmark) | Events (Waymo) |
|---|---|---|
| V2V LATERAL | 15 | 1 (-93%) |
| V2V INTERSECTION | 155 | 8 (-95%) |
| V2V HEAD-ON | 7 | 6 |
| V2V F2R | 35 | 21 (-41%) |
| SINGLE VEHICLE | 33 | 0 (-100%) |
| SECONDARY CRASH | 19 | 11 |
| ALL OTHERS | 6 | 1 (-85%) |
傷害の届け出のあった衝突事故
| Crash Type Group | Events (Benchmark) | Events (Waymo) |
|---|---|---|
| V2V LATERAL | 44 | 10 (-78%) |
| V2V INTERSECTION | 262 | 10 (-96%) |
| V2V F2R | 102 | 57 (-44%) |
| SINGLE VEHICLE | 46 | 2 (-96%) |
| SECONDARY CRASH | 35 | 11 (-69%) |
| PEDESTRIAN | 66 | 5 (-92%) |
| MOTORCYCLE | 31 | 6 (-81%) |
| CYCLIST | 46 | 7 (-85%) |
| ALL OTHERS | 13 | 3 (-78%) |
Waymo 安全調査パートナー
Insurance Institute for Highway Safety(IIHS)最高研究責任者、David Zuby 氏衝突や走行距離に関する詳細なデータを一般公開することで、Waymo の透明性が高まり、独立した調査を後押しするだけでなく、社会からの信頼も増していくことになるでしょう。自動運転システムを開発、展開している他の会社にも、後に続いてほしいと考えています。
手法
手法
自律走行車両と人間のパフォーマンス比較
__人間が運転する車両と自律走行車両の両方の衝突データが一般に公開されてはいるものの、両者を意義のある形で比較するのは簡単ではありません。__公平に比較するためには、考慮すべき要素が多くあります。最も重要なのは次のような内容です。
- 自動運転車と人間のデータでは、衝突の定義が異なります。Waymo のような自動運転車の事業者は、物的損害、負傷、死亡につながった、あるいはつながったとされる物理的接触はすべて報告する必要があります。一方、人間の衝突データでは、警察が事故報告書を作成する程度以上の損害でなければ報告されないものがほとんどです。
- 人間の衝突は、すべてが報告されるわけではありません。NHTSA の推定によると、物的損害が発生した衝突の 60%、負傷を伴う衝突の 32% が警察に報告されていません(Blincoe 他(2023))。これに対して自動運転車の企業は、公道における自律走行の信頼性を示すために、非常に些細な衝突でも報告します。
- 負傷につながる衝突に焦点を当てるべきです。軽微な損傷で済むような低速での衝突は、すぐに修理可能な物的損害しかもたらしません。しかし最も多い事故は、このような低速での衝突です。交通安全の視点で重視すべきなのは、負傷につながる可能性がある重大事故を減らすことです。
- 事故の件数ではなく、事故率(走行距離当たりの事故数)を見るのが重要です。Waymo は、サービスを提供する都市で事業を拡大しています。走行距離が増えると、事故件数も増えていきます。事故率を正確に計算するには、走行距離の合計を考慮することが欠かせません。走行距離を考慮しなければ、実際には事故率が低下していたとしても、事故が増加しているように見える可能性があります。
- 都市の道路は、走行難易度がすべて同じというわけではありません。Waymo の運用は徐々に拡大しており、また、Waymo は配車サービスとして運用されているため、走行条件は主にユーザーの需要を反映しています。このデータハブに掲載された結果では、Scanlon 他(2023)で報告された人間のベンチマークを示していますが、Chen 他(2024)で説明されている方法で、走行条件の違いを考慮した調整を行いました。
Waymo は、自動運転車と人間のデータソースを公平に比較してこのウェブページで示すため、業界のベスト プラクティスを採用しました。分析に関しては、以下でさらに説明しています。また、Waymo の安全性に関する各種資料に、より詳細な説明があります。
このハブで取り上げた Waymo の事故の選択方法
Waymo のデータは、NHTSA の一般命令(SGO)に沿って報告された衝突から取得されており、Kusano 他(2024)に記載されているのと同じ基準を採用しています。他の研究者が結果を再現できるように、意図的に一般公開データを使用しています。このダッシュボードに表示されたデータを NHTSA で公開されている SGO のデータで参照したい場合は、SGO レポートの ID リストと、どの結果グループに属するかを示す情報を、下記ダウンロード セクションでダウンロードしてください。Waymo の衝突率と人間のベンチマークの比較を、いくつかの衝突タイプにわたって比較します。
結果 説明 Waymo データ* 人間のベンチマーク 警察への届け出 警察への届け出がされた衝突 「法執行機関による捜査」のフィールドを「はい」または「不明」として SGO に報告された衝突。 州の衝突データに基づく警察に届け出られた車両衝突率。過少報告補正は行われていません。 負傷の発生 衝突の結果として道路利用者が負傷したもの 「最高負傷程度」のフィールドを「軽傷」、「中等傷」、「重傷」、「死亡」のいずれかとして SGO に報告された衝突。SGO が負傷の程度を不明としている、負傷程度「不明」の報告も含まれています。 1 人以上の道路利用者の負傷が報告されている、警察に届け出られた車両衝突率。Blincoe 他(2023)に基づき、32% の過少報告補正を適用しました。 エアバッグの作動 いずれかの車両でエアバッグが作動した衝突 SGO に報告された衝突のうち、対象車両(SV)または相手車両(CP)について「いずれかのエアバッグが作動したか?」が「はい」のもの。 衝突に関与したいずれかの車両でエアバッグが作動した、警察に届け出られた車両衝突率。過少報告補正は行われていません。 * NHTSA 一般命令 2021-01 の一部として提出された初期データに基づく
人間のベンチマーク
人間のベンチマーク データは、Scanlon 他(2024)で報告されているものと同じです。このベンチマークは、現在 Waymo の自動運転サービスが運用されている地域(フェニックス、サンフランシスコ、ロサンゼルス)において、州警察が報告する衝突記録と自動車走行距離(VMT)から得られます。人間のベンチマークは、Waymo が運用されている種類の道路(高速道路を除く)を走行する乗用車に関する衝突件数と VMT のみを使って作成されました。負傷を伴う衝突のベンチマークでは、人間による衝突の未報告分を考慮し、NHTSA の Blincoe 他(2023)の研究に基づき 32% の過少報告補正も行いました。警察に届け出られた衝突とエアバッグの作動を伴う衝突に関する人間のベンチマークの割合は、過少報告補正を行わずに、観測された衝突数をそのまま利用しています。都市の道路は、走行難易度がすべて同じというわけではありません。Waymo が、難易度が高く、衝突率の高い場所をより頻繁に走行すれば、閑静な地域を走行した場合と比較して衝突率が上がる可能性があります。Scanlon 他に記載されているベンチマークの対象は、特定の道路や地域ではなく、都市レベルです。このデータハブで示されている人間のベンチマークは、Chen 他の 2024 年の論文に記載された、衝突リスクに関する空間分布の影響をモデル化する手法を利用して調整されています。この手法により、都市レベルのベンチマークが、Waymo の独特な走行分布を考慮して調整されます。重み付けを変える手法を採用することで、人間のベンチマークは、Waymo が最も多く走行する都市内の地域をより適切に反映します。これにより、Waymo と人間の間で、衝突データの整合性が向上します。利用可能なデータの制限を考慮しながら、可能な限りデータ調整を行う方法は、Scanlon 他、2024b で新たに公表された、遡及的な自動運転車の評価(RAVE)のベスト プラクティスに含まれています。
信頼区間とデータ制限
100 万マイル当たりの事故数(IPMM)の衝突率に関する信頼区間は、ポアソン正確法を使って計算されます。割合減少に関する信頼区間には、Nelson(1970)に記載されている Clopper-Pearson 二項分布を使用しました。どちらの信頼区間も、95% の信頼水準で評価されました。これらの信頼区間は、Kusano 他(2023)に記載されたのと同じ手法を使用します。現在使用可能なデータには、人間と自動運転車を完全に同じ条件で比較できるものは存在しません。このページに記載されたベンチマークや比較は、この分野における最先端の研究に基づいた、現状最先端である人間と自動運転車のデータソースです。エアバッグの作動を伴う衝突の過少報告に関する推定値がないため、エアバッグ作動に関するベンチマークでは、人間のデータに対する過少報告補正は行われていません。未報告件数は、自動運転車の衝突に比べて、人間の衝突の方が多くなりがちです。負傷を伴う衝突のベンチマークには、全国の警察による事故報告、保険データ、全国的な電話調査の多項目分析に基づく Blincoe 他(2023)に記載された過少報告補正を適用しています。負傷を伴う衝突に関する過少報告推定値は、情報源が複数にわたるため、信頼区間の計算が容易ではありません。また、過少報告値が場所によって異なる可能性を示す情報もあるため、全国的な推定値は、Waymo が運用されている都市における過少報告値を正確には表していない可能性があります。エアバッグ作動のベンチマークと同様に、警察への届け出に関しては、自動運転車のデータよりも人間のデータで未報告件数(すなわち、報告基準を満たすが警察に報告されていない衝突)が多い可能性が高いものの、過少報告の予測は行われていません。これらの結果の制限に関する包括的な議論については、Scanlon 他(2024)と Kusano 他(2024)を参照してください。
- Scanlon, J. M., Kusano, K. D., Fraade-Blanar, L. A., McMurry, T. L., Chen, Y. H., & Victor, T. (2024). Benchmarks for Retrospective Automated Driving System Crash Rate Analysis Using Police-Reported Crash Data. Traffic Injury Prevention (In Press). DOI:10.1080/15389588.2024.2380522.
- Kusano, K. D., Scanlon, J. M., Chen, Y. H., McMurry, T. L., Chen, R., Gode, T., & Victor, T. (2024). Comparison of Waymo Rider-only crash data to human benchmarks at 7.1 million miles. Traffic Injury Prevention (In Press). DOI:10.1080/15389588.2024.2380786.
よくある質問
1. 結果は信頼できるか?
1.1. 安全性に関する影響の調査結果は、Waymo と人間の運転を公平に比較したものですか?
1.1.1. 安全性への影響に関する調査はどのように立案、実施されていますか?
衝突事故率の比較そのものは、自動運転システム(ADS)とベンチマークそれぞれの衝突事故数と走行距離という 4 つの指標の比較にすぎませんが、調査立案や使用するデータソースに関する多くの決定事項が、導き出される結果に影響し得ます。安全性への影響に関する調査は、車両の安全に関する研究文献でよく使用されてきたツールであり、その歴史は、横滑り防止装置や自動緊急ブレーキなどの安全性の向上にまで遡ります。動的運転タスク全体を担う ADS には特有の課題があるため、ADS の安全性への影響に関する研究のベスト プラクティスについて専門家の合意をまとめた RAVE チェックリストが公開されています。現在国際標準化が進められているこのチェックリストは、Safety Impact Data Hub で紹介されているような、ADS の安全性に関する影響調査を実施するためのベスト プラクティスを定めています。安全性の影響データハブの基盤となる研究は、RAVE チェックリストに準拠するように立案されています(RAVE チェックリストの要件に対する適合性評価については、オンラインの資料、Kusano 他、2025)を参照)。
1.1.2. Waymo の衝突事故はすべて報告されていますか?
Waymo の安全性に関する影響の調査は、米国運輸省道路交通安全局(NHTSA)の常設一般命令(SGO)で義務付けられている報告に基づいています。Waymo を含むすべての自動運転システム(ADS)の運営業者(Waymo のような自動運転車両の運営業者を指す技術用語)は、SGO を遵守し、指定された報告期間内に要件を満たすすべての衝突事故を報告する必要があります。NHTSA は、ADS 運営業者の SGO レポートに報告の不整合があると判断した場合、調査して是正措置を講じる権限を有しています。SGO の報告要件には、軽微な損傷を伴う衝突事故が含まれます。これは、従来の警察報告と保険の事故データベースよりも低い報告基準(より多くの軽微な事故が含まれる)です。負傷者が発生したとの報告があった、またはエアバッグが作動したすべての事故(安全影響データハブの分析が注目している事象)は、SGO の一環として報告する必要があります。したがって、Waymo のフリートの厳格な報告要件と運用ポリシーを考慮すると、データハブに報告された事象をもたらした衝突事故が発生したにもかかわらず、これが含まれていない可能性は非常に低いと考えられます。参考までに、NHTSA の報告(Blincoe 他、2023)によると、人間による運転車両の衝突の過少報告は、物損事故の 69.7%、人身事故の 31.9% にのぼります。Waymo のレポートは、高性能なセンサー群が検出して把握したすべての衝突に関するもので、より完全なレポートとなっています。
Waymo は、警察が報告したデータを使用してベンチマークを導き出しているため、Waymo 車両がレッカー移動され、衝突時に接触事故となったもののみがベンチマークとの比較に含まれます。警察の報告データでは、衝突の過程で物理的な接触がなかった車両は、衝突事故データには当事車両としては含まれません。したがって、Waymo 車両との接触はなかったものの(衝突への関与が疑われるため SGO で報告される可能性はあります)、SGO で報告された Waymo の衝突を、衝突事故発生率と比較して過大にカウントすることになります。同様に、Waymo 車両は、次のお客様へのサービスに備えて、適切な駐車スペースで待機していることがあります。この場合、ADS ソフトウェアはアクティブになっていますが、車両はパーキング状態で、適切な駐車スペース(駐車区画、または縁石から 18 インチ以内の路上駐車スペース)に駐車しています。警察の報告書データでは、このような駐車車両も車両数には含まれません(駐車車両は固定物とみなされます)。
1.1.3. Waymo と人間の運転者のデータは同じ基準で事故結果を測定しているのですか?
自動運転システム(ADS)と人間による衝突データの間の整合性をとることは、公平な比較を行うための最も重要な要素の一つであり、データの整合性には「衝突」の定義に一貫性を確保することが重要です。Waymo の安全性への影響に関する調査では、過去の安全性評価調査を起点として、自動運転システムと人間の運転者両方のデータソースで最も公平で確実に特定できる衝突結果を採用しています。最も広く行きわたり、信頼性の高い人身事故データソースは、警察の報告書データベースです。人間の衝突は、特に軽微なものは、すべてが警察に報告されるわけではありません。エアバッグの作動や負傷(重傷以上、またはあらゆるレベルの負傷)につながる重大な衝突は、軽微な物的損害にとどまった衝突より、安全性の評価に適しています。
重傷以上、エアバッグの作動、負傷の発生につながる衝突は、軽微な物的損害にとどまった衝突よりも安全性の評価に適していると考えていますが、軽微な衝突事故の発生率についても、データハブ ウェブサイトのダウンロード セクションで入手できるベンチマーク(物的損害または負傷の発生、警察への届け出など)と比較して追跡、報告しています。
1.1.4. 比較において、天候などのさまざまな運転条件は考慮していますか?
Waymo の安全性に関する影響調査では、人間のベンチマークと Waymo の運転条件の整合性をとるために、次のようにいくつかの手法が使用されています。(a)Waymo が事業を展開しているカウンティーの人間の運転者のデータを使用する、(b)位置情報に基づく動的なベンチマーク調整を行う。運転条件は都市によって異なり、すべての道路や運転条件が同じように危険なわけではありません。Waymo の安全に関する影響調査では、地域の事故リスクを把握するために、Waymo が現在事業を展開しているカウンティーに限定して、州が管理する衝突事故データと走行距離(VMT)のデータソースを使用しています。カウンティー内でも、場所によって人身事故の発生率は異なります。一般的に、人口密度の高い都市部では、人口密度の低い地域よりも衝突事故率が高くなります。この効果を捉えるため、Waymo の安全性に関する影響の結果では、Waymo のサービスが各地域で走行した距離に比例して人間のベンチマークに重み付けする動的なベンチマーク調整を使用しています(Kusano 他、2025、Chen 他、2025 を参照)。Waymo の運転と、同じ場所でのベンチマーク運転を比較することで、運転条件の影響の多くがおのずと考慮されます。Waymo の調査では、衝突事故率は地理的条件によって大きく異なることがわかっています。そのため、Waymo の運転と比較する際に、全国平均のベンチマークの使用は適切ではないと考えています。
地域の事故データと動的な調整を通じて、ベンチマークの事故率を Waymo の運転環境により適切に合わせることで、事故のリスクに影響を与え得る多くの要因を勘案することができますが、これですべての要因がとらえられるわけではありません。たとえば、Waymo が現在サービスを展開している都市では、降雪量はそれほど多くありません。そのため、Waymo のベンチマーク データにも人間運転者のベンチマーク データにも、このような悪天候は含まれていません。Chen 他 (2025) found that time of day affects crash rates (crash rates late at night are generally higher than during the day). ベンチマークと Waymo のデータを照合する際に、より多くの要素を考慮するうえでよく妨げとなるのは、人間の運転者の走行環境と各走行量に関するデータが不足していることです。たとえば、動的ベンチマークに使用される走行距離データは年間平均として提供されるため、時間帯に合わせて調整することはできません。ベンチマークと Waymo のデータの整合性をさらに高めるために、人間の運転に関して別のデータを提供できる他のデータソースを検討しています。
1.1.5. ベンチマークで Waymo がサービスを提供している地域のすべての人間の運転者を比較対象としているのはなぜですか?
安全性への影響に関するデータハブの結果では、Waymo の衝突事故実績を、Waymo がサービスを提供している地域で現在人間が運転するフリートの衝突実績と比較しており、ここでは Waymo と人間の衝突事故データを公平に比較するためのベスト プラクティスを用いて条件の整合性をとっています。この比較は、「Waymo の運転は現状にどのような影響を与えるか」という調査の質問に答えるものです。この種の調査の質問は、新しい車両技術が開発、導入される際に研究者が尋ねる最も基本的な問いです(自動緊急ブレーキ、電子安定性制御など)。このような現状との比較は、車両技術が交通安全を改善する可能性を示しています。
Waymo の他の研究では、他の集団との比較を調査しています。たとえば、衝突回避能力を調査した以前の研究と未然的安全性評価手法では、Waymo Driver の衝突回避能力を「危険事象に目を向けている、酒気を帯びなどのない正常な状態のドライバー(NIEON)」の能力と進んで比較しています。しかし、このベンチマークの衝突事故発生率を比較可能なものとして作成するには、方法論上の課題があります。これは、人間の運転者は運転中に常に NIEON 状態にあるわけではないため、ベンチマークを定量化するために「NIEON」のような運転者の正確な走行距離(VMT)を容易に入手できないことが主な原因です。 Waymo と共同で実施したスイス再保険会社の別の調査(査読中)では、Waymo の第三者請求率が、最新世代の車両を運転する人間の運転者と比較されています。これは、最新世代の車両は通常安全機能が向上しているため、人間が運転する車両の別の、より高性能なサブセットです。
また、タクシーや人間が運転する配車サービスといった他の運転者集団との比較も、多くの示唆を与えてくれるでしょう。一般の警察報告書や公になっている走行距離データベースでは事故の重大度にわたって定量化した分析は行われていますが、現在のところこれらの特別な集団については一般公開されている(したがって独立して検証可能な)事故や走行距離のデータソースはありません。 飲酒や疲労などの影響を受けていない運転者のベンチマークについても、さらに期待が高まっています。この比較は有用ではありますが、現状の衝突事故発生率の低減を評価するものではありません。特別な集団の事故率と同様に、飲酒などの影響を受けた運転者の衝突事故件数とその走行距離の両方の地域ごとの推定値を算出することは困難です。新しいデータソースが利用可能になるにつれて、これらは困難はあっても、価値のある研究分野となります。
1.1.6. Waymo が衝突事故の一連の流れ全体から最も重い負傷を判定基準としているのはなぜですか?
傷害の程度は、さまざまな方法で測定できます。測定では Waymo 車両の乗員に分析が偏りすぎないようにしましたが、これは Waymo 車両外の人が傷害を受ける衝突事故において、Waymo が安全性にもたらす影響を過小評価することになりかねないためです。そこで、衝突事故レベルの評価指標として、衝突事故の一連の流れ全体で関与したすべての人が被った最も重大な傷害に着目しました。車両の安全性に関する研究では、衝突レベルでの傷害の最大の程度を指標とするのが一般的であり、実際、警察の報告書での項目として直接記載されていることがよくあります
。
1.2. Waymo は、確信を持って結論を導き出せるほど十分な走行距離を走行していますか(統計的有意性)?
Waymo の走行距離(数億マイル)は、Waymo が走行する都市での走行距離(数十億マイル)や、米国全体の年間走行距離(数兆マイル)と比較すると、見劣りするように思えるかもしれません。ただし、2 つの母集団の割合を比較する場合、データから導き出せる結論は、統計的検出力と呼ばれるものに左右されます。安全性に関する影響データハブで得られる答えは、Waymo とベンチマークの衝突事故率は異なるか?です。この計算の入力は、Waymo とベンチマーク集団の事故件数と走行距離であり、カウントデータを処理する最も一般的な分布であるポアソン分布を使用してモデル化されます。
この問題の例としては、試験に合格しなかった生徒の数を調べる場合が挙げられます。ある学区で、同じテストを受けた 1,000 人の生徒のうち 300 人が不合格だったとします(受験者 10 人につき 3 人が不合格)。このテストで、クラス A の 20 人の生徒の成績が全体と異なるかどうかを調べてみましょう(この単純な例では、テストに合格するか不合格になるかは、クラス A に所属しているかどうかとは無関係であると仮定しています)。たとえば、A 組の生徒 20 人のうち 10 人が試験に合格しなかったとします(受験者 10 人につき 5 人が不合格)。A クラスの不合格率は、学区の不合格率の 2 倍でした。しかし、ポアソン信頼区間を使用すると、20 人のクラスの不合格率は、95% の信頼水準で学区の平均と統計的に差がありません。代わりに、クラス A を州全体の 10 万人の生徒と比較すると(10 人の受験者あたり 3 人が不合格という同じ割合、つまり 10 万人中 3 万人が不合格)、この比較の 95% 信頼区間は、カウンティー(1,000 人の受験者中 300 人)との比較とほぼ同じになります。つまり、この比較では、クラス A での少数の観測値(生徒 20 人のみ)の不確実性は、より大きな母集団の不確実性よりもはるかに大きくなります。今度は別のクラス B を見てみましょう。このクラスでは、20 人の生徒のうち 1 人だけがテストに合格しませんでした(テスト受験者 10 人あたり 0.5 人が不合格)。95% 信頼区間を適用すると、このクラス B はカウンティーの平均合格率と統計的に異なる合格率を示しています(州の平均と比較した場合も同様)。この例では、2 つの母集団で事象の発生率を比較する場合、一方の母集団がもう一方の母集団よりもはるかに大きい(受験者数または走行距離で測定)と、統計的有意性を左右する 2 つの要素は、(a)小さい母集団の観測数(観測数が多いほど有意性が早く得られる)と、(b)発生率の差が大きいほど(差が大きいほど有意性が早く得られる)であることがわかります。
次に、Waymo のデータを使用した別の実験を考えてみましょう。下の図では、Waymo のエアバッグ作動回数(34 回)と VMT(総走行距離、7,110 万マイル)を一定に保つ一方、人間のベンチマーク集団の走行距離として桁違いに大きい数値を想定しています(178 億マイルの走行で、100 万マイルあたり 1.649 件の事故というベンチマーク率)。点推定では、Waymo の事故件数はベンチマークより 71% 少ないとされています。信頼区間(エラーバーとも呼ばれます)は、95% の信頼水準でこの削減の不確実性を示しています(95% の信頼水準は、ほとんどの統計的テストで標準となっています)。エラーバーが 0% をまたがない場合、統計的に見て、結果が偶然によるものではないと 95% の確信を持って言えることを意味します。これは統計的有意性とも呼ばれます。この「シミュレーション」は、ベンチマーク母集団の VMT を変更した場合の統計的有意性への影響を示しています。この比較は、ベンチマークの走行距離が Waymo の走行距離(1,000 万マイル)よりも少ない場合でも、統計的に有意です。さらに、人間のベンチマークが 1 億マイルを超えている限り、比較の信頼区間にほとんど差は見られません。つまり、米国の主要都市(数十億マイルに基づく)での比較は、米国の年間総走行距離(数兆マイル)との比較して、統計的な観点から違いはありません。学校のテストの例と同様に、Waymo は十分な走行距離(数千万から数億マイル)を走行しており、削減幅も十分(70~90% の削減)であるため、統計的有意性を達成していると言えます。
1.3. 使用されている手法は、外部による審査や検証が行われていますか?
この分析では、Scanlon 他(2024 年)、Kusano 他(2024 年)、Kusano 他(2025 年)で紹介されている手法と人間のベンチマークを利用しています。
これらの研究論文は、査読付きの科学雑誌に掲載されています。
引用:
Scanlon, J. M., Kusano, K. D., Fraade-Blanar, L. A., McMurry, T. L., Chen, Y. H., & Victor, T. (2024). Benchmarks for Retrospective Automated Driving System Crash Rate Analysis Using Police-Reported Crash Data. Traffic Injury Prevention, 25(sup1), S51-S65.
Kusano, K. D., Scanlon, J. M., Chen, Y. H., McMurry, T. L., Chen, R., Gode, T., & Victor, T. (2024). Comparison of Waymo Rider-only crash data to human benchmarks at 7.1 million miles. Traffic Injury Prevention, 25(sup1), S66-S77.
Kusano, K. D., Scanlon, J. M., Chen, Y. H., McMurry, T. L., Gode, T., & Victor, T. (2025). Comparison of Waymo Rider-Only Crash Rates by Crash Type to Human Benchmarks at 56.7 Million Miles. Traffic Injury Prevention, 26(sup1), S8–S20. https://doi.org/10.1080/15389588.2025.2499887.
査読とは、研究論文を学術誌に投稿し、その研究分野の専門知識を持つ匿名の研究者が論文を審査して改善点を提案することです。査読プロセスは、研究成果を公開するためのゴールド スタンダードとして確立されています。このプロセスでは、結果を再現できるほど十分詳細に研究が記述され、研究の結論が結果によって裏付けられている必要があります。Safety Impact Data Hub で使用されている手法は、査読付き論文と同じであり、手法に一定の透明性を確保しています。学術出版の慣例に従い、論文が査読を受けている間は、論文のプレプリントを公開することもよくあります。これは、現在の一般的な慣行であり、私たちの研究を広め、科学コミュニティからのコメントを求めることを目的としています。
1.4. 生データは研究者に対して公開されていますか?
はい。Data Hub の結果は、一般公開されているデータを使用して再現できます。1.1.2 で説明したように、Waymo の衝突件数はすべて、NHTSA の常設一般命令(SGO)の一部として報告されたイベントに基づいています。さらに、データハブのすべての統計情報の生成に使用された生データは、CSV ファイルのダウンロードとして提供されるため、研究者やその他の第三者は結果を再現して検証できます。これには、各提供地域で走行したマイル数(CSV1)、分析に含まれる各ケースの SGO ケース識別と結果カテゴリ(CSV2)、地域、結果、事故の種類別に集計されたベンチマークの事故率との比較(CSV3)、動的な場所の調整に使用される市内の詳細な地点ごとの走行したマイル数(CSV4)が含まれます。データハブで使用されている方法は、査読された、オープン アクセスの論文に基づいています(引用については質問 1.3 を参照)。
1.5. 結果が 1 マイルあたりの衝突事故車両数で示されているのはなぜですか?
車両の衝突事故率(車両レベルの衝突事故率)は、事故結果が特定のレベル以上での衝突事故となった車両の数をカウントし、人口レベルの総走行距離(VMT)で割ることで算出されます。Waymo の衝突事故については、衝突した車両の割合は、事故結果が特定のレベル以上での衝突事故となった Waymo 車両の数を、Waymo の乗客のみ(RO)での走行距離の合計で割ったものとして計算されます。ベンチマークとしては、警察の報告書データで特定の事故結果の衝突事故に関与した車両の総数を、人口レベルの総 VMT で割った値を用いています。
別の指標としては、衝突事故レベルの発生率(人口レベルの VMT あたりの事故件数)があります。衝突事故レベルのベンチマークを使用して自動運転システム(ADS)フリートの車両レベルの割合と比較すると、単位の不一致が生じて誤った結論につながる可能性があります。これを説明するには、次の単純な例を使用するとわかりやすいでしょう。あるベンチマーク集団に 2 台の車両があり、それぞれ 100 マイル走行した後に互いに衝突するとしましょう(衝突車両は 2 台、衝突は 1 回、人口レベルの VMT は 200)。衝突事故レベルの事故率は 100 マイルあたり 0.5 件(衝突 1 件 / 200 マイル)ですが、車両レベルの事故率は 100 マイルあたり 1 件(衝突 2 件 / 200 マイル)です。これは、警察の報告書にある衝突事故データからベンチマークを導き出すのと似ています。警察の報告書では、1 回の衝突に平均 1.8 台の車両が関与し、VMT データにはすべての車両の VMT が推定されています。次に、2 つ目の ADS 集団を考えます。この集団には車両が 1 台あり、100 マイル走行した後に、集団外の車両と衝突するとします。この状況は、ADS フリートのデータ収集方法に似ています。ADS フリートの VMT が、ADS 車両が関与した衝突事故とともに記録されています。ADS フリートについては、衝突した車両(車両レベル)の割合は 100 マイルあたり 1 台です。分析で、100 マイルあたり 0.5 件の事故という事故レベルのベンチマーク率と、100 マイルあたり 1 台の事故車両という ADS 車両レベルの率を誤って比較した場合、ADS フリートの事故率はベンチマークの 2 倍であるという結論になってしまいます。実際には、この例では、100 マイル走行ごとに 1 台の車両が衝突する ADS の衝突事故発生率は、100 マイル走行ごとに 1 回の衝突に個々のドライバーが関与するベンチマークの衝突率と変わりません。
調査機関が提供する要約統計では、衝突に関与した車両の数ではなく、衝突の数が記載されていることが多いために、集計統計を使用する場合に、衝突事故レベルの率と車両レベルの率を比較するというこの間違いが起こりやすくなります。たとえば、Scanlon 他(2024 年)によると、2022 年に警察に報告された衝突事故は全米で 5,930,496 件あり、10,528,849 台の車両が関与していました。2022 年の全米の VMT の合計は 3.2 兆マイルでした。つまり、米国の衝突事故レベルの衝突事故率は 100 万マイルあたり 1.9 件であるのに対し、車両レベルの衝突事故率は 100 万マイルあたり 3.3 台です。
交通安全についてよく使用されるもう 1 つの指標は、VMT あたりの負傷者数(つまり、人レベルの事故率)です。人レベルの事故率は、事故にかかる損失、損害を人レベルで表す指標としてメリットがあります。しかし、人レベルの事故率は、Safety Impact Data Hub で行われているように、ある集団と別の集団を比較する場合には理想的な指標とは言えず、実用面と解釈面でいくつかの問題があります。混合トラフィックで運用される ADS フリートの人レベルの事故率は、事故関与率が同じままであっても、フリートの規模(または普及率)が大きくなるにつれて低下するように見えてしまいます。衝突には複数の車両が関与することが多いため、フリートの規模が大きいほど、複数の ADS 車両が衝突に関与する可能性が高くなります。これにより、人レベルの事故率が低下します(衝突に関与する人数は同じですが、VMT が増加します)。つまり、テストの初期段階では、ADS がベンチマーク集団と同じような数の衝突事故に関与していたとしても、ADS フリートの人レベルの事故率はベンチマークよりも高く見えることになります。このバイアスに対処するには、ある結果における事故の当事者の合計数を、衝突事故の車両数で割った、人レベルの事故率を計算できます。この人レベルの事故率は、複数の車両におけるバイアスに対処するものですが、結果の解釈に別のバイアスが生じます。この分数人単位の衝突事故発生率では、複数の車両が関与する事故よりも、関与する車両が少ない事故により大きな重み付けがされてしまいます。また、自動運転システム事故に関する最も包括的な情報源である NHTSA の常設一般命令では、事故における負傷の最大重症度のみが報告され、特定の重大度レベルでの負傷者の数は報告されないという実用的な制約もあります。そのため、現時点では SGO データから人レベルの事故率を計算することはできません。この制約は、最大重大度のみが報告される一部の州の衝突事故 データベースでも同様です。こうした解釈のバイアスや報告に関する制約の可能性があるため、ADS とベンチマークの衝突率を比較する際には、人レベルの率よりも車両レベルの率が望ましいと言えます。
1.6. 1 マイルあたりの衝突事故数と衝突事故間のマイル数の違いは何ですか?
数学的には、1 マイルあたりの事故数と事故間のマイル数は互いに逆数の関係にあります(つまり、1 マイルあたりの事故数と事故間のマイル数を相互に変換するには、1 をその率で割るだけです)。ただし、RAVE チェックリストの推奨事項に記載されているように、衝突事故率を 1 マイルあたりの衝突事故数で示すべき重要な理由があります。その理由は、1 マイルあたりの事故件数指標はイベント数と線形関係にあるのに対し、事故間のマイル数の逆数は非線形関係にあるためです。この非線形な関係により、レートの変化を比較することが難しくなります。同様の難しさは、車両の燃料効率(1 ガロンあたりの走行距離と 100 マイルあたりのガロン数)などの他の測定でも指摘されています。
RAVE チェックリストに記載されているように、「1 件の衝突事故あたりの走行距離が 100 万マイルの自動運転システム(ADS)と、ベンチマークとして 75 万マイルのものを比較するとします。別の ADS は、衝突事故あたり 500,000 マイルであり、これをベンチマークの衝突事故あたり 250,000 マイルと比較するとします。どちらの場合も、衝突事故 1 件あたりの走行距離の差は 250,000 マイルであり、パフォーマンスの差が同程度であるかのような錯覚を与えます。しかし、前者の比較では、マイルあたりの事故件数を 25% 削減する ADS(1 IPMM 対 1.33 IPMM)が示されていますが、後者ではマイルあたりの事故件数を 50% 削減する ADS(2 IPMM 対 4 IPMM)が示されています。走行距離あたりの事故発生率は事故件数に正比例という線形関係にある一方、事故 1 件あたりの走行距離は線形関係にはないため、相対的な率の比較がより難しくなることは一見して明らかではありません。」
RAVE チェックリスト の図 2
2. テスト結果について
2.1. 安全性への影響の結果から、どのようなことがわかりますか。
2.1.1. このデータは Waymo Driver が人間より安全であることを示していますか?
この調査では、Waymo Driver が走行する地理的エリアにおいて、走行距離あたりの特定の事故件数で測定した結果、Waymo Driver は全体としてみた人間の運転者よりも安全であることが示されています。この調査では、Waymo Driver の安全性能を、同じ地理的エリア内の人間が運転するすべての車両と比較することに重点を置いています。人間運転者による衝突事故発生率は、その地域の運転の「現状」と考えることができます。この比較は、安全性の影響分析で使用され、Waymo のテクノロジーの導入が現状と比較してどの程度効果的かを判断します。
人間の運転者による全体的な衝突事故発生率は一般的な統計指標であり、米国と世界の大部分でほぼ普遍的に存在する長年のデータ報告慣行によって可能になっています。 年次推移の傾向と、地域全体のドライバー集団が直面する体系的な課題を調査することは、長年にわたって行われてきました。衝突事故データは、さまざまなパフォーマンス サブセット(車両の種類や運転者の酩酊状態などの要因)に関する情報を提供しますが、対応する VMT データには、このような粒度の細かい内訳が通常ありません。たとえば、運転者の飲酒などの要因による事故率を比較するには、飲酒運転をした運転者の VMT を把握するか、推定する必要があります。特定のドライバー層を対象とした包括的な衝突リスク分析についての調査は、これまで重視されてきませんでした。
2.1.2. 安全性への影響に関する結果は、Waymo が「十分に安全」であることを示していますか?
統計的に有意な減少は安全上のメリット(つまり、事故が少ないこと)を表しますが、「十分に安全」という主張は、自動運転システム(ADS)の具体的な構成のリリース_前_に、Waymo の安全フレームワークとセーフティ ケースを通じて行われます。安全への影響の目標は、自動運転システムの合理的な安全レベルを確立することではありません。Waymo は、安全フレームワークを使用して、特定のソフトウェア リリース候補版の承認ガイドラインに従って安全性が十分に確保されているかどうかを判断します。 さらに、このようなプロセスの適切性に関する独立した分析が、セーフティ ケースを通じて行われます。セーフティ ケースとは、ADS 開発者が、システムが十分に安全で、人間の運転者なしで公道に配備できると判断するプロセスを説明する正式な方法です。セーフティ ケースには、不合理なリスクがないことを正式に判断するための証拠が含まれています。これには、システムの説明、システムの検証に使用する手法と指標、検証テストの実際の結果が含まれます。一方、Safety Impact Data Hub が示す事後的な証拠は、安全フレームワークとセーフティ ケースのデプロイ後の検証の役割を果たします。安全フレームワークとセーフティ ケースのプロセスに対する信頼を継続的に構築するこのサイクルは、Waymo が新しい分野に拡大するにつれて、同様の安全性の影響結果が得られるという信頼も構築します。
2.1.3. Waymo のパフォーマンスは、ソフトウェアとハードウェアのリリースが異なればどのように異なりますか。
安全性への影響に関する調査のほとんどは、これまでに蓄積されたすべての乗客のみ(RO)での走行距離の事故を使用しています。Waymo の走行距離は時間の経過とともに大幅に増加しており、古い走行距離よりも新しい走行距離の方が Waymo の走行距離に占める割合が大きくなっています。「Waymo の乗客のみの走行とベンチマークの衝突事故率の比較が、より多くのカテゴリに分けられていないのはなぜですか?」というよくある質問と同様に、走行距離をより細かく分割すると、分析の統計的検出力が低下します。これは、安全性が重要な他の分野でもよく指摘されている制約です。
過去の安全システムに関する安全性への影響調査では、複数のソフトウェア リリースや、異なるメーカーのデータをひとまとめに扱うことは一般的に行われています。たとえば、米国交通安全保険協会と PARTS コンソーシアムの調査では、自動緊急ブレーキや車線逸脱防止などの技術に着目し、複数のメーカーをまとめて、その技術の全体的な影響を判断することがよくあります。同様に、Waymo の安全性への影響に関する調査では、Waymo Driver の全体的な影響が示されています。走行距離がさらに伸びれば、より短い期間における Waymo の安全性への影響を調査する機会が得られます。
Waymo の安全性への影響に関する調査では、「現在の人間が運転する車両の事故率(現状)と比較して、Waymo の安全性への影響はどうか」という問いに答えることを目指しています。少し異なりますが、同様に重要な問いとしては、「Waymo は新しいソフトウェアやハードウェアのリリースが安全であるとどのように確信しているのか?」です。この 2 つ目の問に答えるために、Waymo は安全フレームワークとセーフティ ケース アプローチを策定しました。つまり、車両アーキテクチャ、運転行動、運用レイヤにわたる一連の手法を使用して、判定基準に照らして新しい候補構成のパフォーマンスを評価します。
2.1.4. Waymo の死亡事故への影響は?
Waymo は、死亡事故への関与など、将来の評価に使用されるさまざまなベンチマークを公開しています。現在、Waymo の走行距離は、走行エリアで統計的有意性を検出するには十分ではありません。そのため、報告書では死亡事故のみのカテゴリを設けていません。Waymo Driver は、NHTSA の最新データに基づく死亡事故の主要な原因(スピードの出しすぎ、飲酒運転、不注意運転、シートベルト未着用)を本質的に減らす、またはなくすように設計されています。 「重傷以上」のカテゴリには、重傷と死亡の両方が含まれます。他のすべての事故結果カテゴリにも死亡事故が含まれます。
Waymo のアプローチは、(a)ベンチマーク、手法、意図した分析の視点を積極的に公開し、(b)以前に完了した検出力分析(データ量が十分かどうかの評価)で有意性が検出される可能性があることが示された場合に、確立されたベンチマークで評価を実施し、(c)データハブと科学出版物で調査結果を公開することです。
自動車の安全性に関してこれまで行われてきた技術革新と同様に、技術が広く普及して走行距離が蓄積する前に、潜在的な影響を判断する方法もあります。たとえば、アリゾナ州チャンドラーで発生した人間の運転者に関する死亡事故を再現した調査では、Waymo Driver が加害者側であった場合は 100%、被害者側でも 82% の確率で死亡事故を避けられたという結果が、シミュレーションにより導かれました。このような研究は、Waymo の安全対策判定プロセスと組み合わせることで、Waymo Driver が重傷事故や死亡事故を大幅に削減する可能性があることを示しています。
2.1.5. 「重傷以上」の事故率と「死亡事故」の事故率はどれだけ違いますか?
自動車の安全に関する研究では、一般的に一定レベル以上の負傷を調査します。Waymo の分析では、「重傷以上」には、重傷の疑い(米国の警察報告書で使用される KABCO スケールの「A」レベル(重傷))と致命傷(KABCO スケールの「K」レベルの傷害)の両方が含まれます。Waymo は、独自のカテゴリとして「K」レベルの衝突、_死亡事故_を含むベンチマークを公開しています。この成果は現在、Safety Impact Data Hub の一部として報告されていませんが、後日追加する予定です。
「重傷」(「A」レベルの負傷のみ)だけを見ると、除外バイアスが生じる可能性があります。たとえば、治療によって死亡例のみが発生し、重傷が疑われる例がほとんど発生しなかった場合、死亡例がカウントされないため、治療が実際よりもはるかに安全であるという誤った結論につながる可能性があります。「以上」という条件を追加することで、この誤りを回避できます。
2.2. 安全性への影響に関する調査で考慮されていないもので、結果の解釈に影響を与える可能性のある他の要因はありますか?
2.2.1. 人間がリモートで支援する必要がまれにあるならば、Waymo は実際には自律型ではないのではありませんか?
Waymo の安全性に関する影響調査では、同等の地域を走行する Waymo の車両と人間の運転者との間で、事故率にどのような違いがあるかを調査しています。リモート支援により、Waymo Driver は、特定の困難な状況やまれな状況で周囲の状況を把握するために、人間のエージェントに連絡して追加の情報を得ることができます。リモート アシスタンスは、Waymo Driver の設計当初から組み込まれており、Waymo が安全に事業を拡大できた理由の一つとなっています。Waymo のリモート アシスタンス プログラムは、この分野の業界のベスト プラクティスに準拠しており、業界のベスト プラクティスに従って実際に自律走行していることを示す独立した第三者による監査を受けています(1、2)。
2.2.2. 自律走行車は、人間が一生のうちに遭遇するあらゆる困難な状況に対処できるのでしょうか?
現在、Waymo Driver は 1 週間あたり数百万マイルを走行しています。Waymo Driver は、路上とシミュレーションで走行した総走行距離を考慮すると、人間の生涯にわたる運転経験を数百回分も積み重ねていることになります。この規模になると、駐車車両の陰から歩行者が突然現れる、別の車両が信号無視をするといった難しい状況もよくあることです。人間が一生のうちに経験するような困難な状況の多くに Waymo Driver が対応できないのであれば、Waymo の事故率は人間の運転者と比べてそれほど低くはならないでしょう。
Waymo は、安全フレームワークを使用して、特定のソフトウェア リリース候補版の承認ガイドラインに従って安全対策を判断しています。 さらに、このようなプロセスの適切性に関する独立した分析が、セーフティ ケースを通じて行われます。セーフティ ケースとは、ADS 開発者が、システムが十分に安全で、人間の運転者なしで公道に配備できると判断するプロセスを説明する正式な方法です。セーフティ ケースには、不合理なリスクがないことを正式に判断するための証拠が含まれています。これには、システムの説明、システムの検証に使用された方法論と指標、検証テストの実際の結果が含まれます。
2.2.3. Waymo の車両が乗客を乗せずに走行している場合(回送運転とも呼ばれます)、車内に負傷する可能性のある人がいない(運転者がいないため)ことは、安全上のメリットにつながりませんか?
Waymo の安全性への影響に関する調査の結果、Waymo は、人間が運転する車両の現状と比較して、車両走行距離あたりの人身傷害事故が少ないことがわかりました。メリットの一つは、Waymo 車両に誰も乗っていない場合があることです(たとえば、充電のためのデポへの行き来や、乗客を迎えに行くときなど)。Waymo の安全性への影響に関する調査で検討された指標は、Waymo 車両に乗車しているかどうかにかかわらず、衝突シーケンスに関与したすべての人の負傷を考慮していることに注意することが重要です。これには、歩行者や自転車に乗っている人などの交通弱者や、衝突事故に巻き込まれた他の車両の乗員が含まれます。したがって、Waymo 車両が時に無人であることによるメリットが多少あったとしても、無人であることだけでは、Waymo の負傷を伴う衝突事故の大幅な減少を説明することはできません(車両は常に無人であっても、車両外の人を負傷させる可能性のある衝突事故を起こす可能性があります)。エアバッグの作動指標などのその他の結果は、Waymo 車両の乗車率の影響を受けません。Waymo 車両のエアバッグは、Waymo 車両に人間が乗っているかどうかに関係なく作動します。ベンチマークと比較したエアバッグの作動回数の減少幅は、負傷を伴う衝突事故の減少幅とほぼ同じです。このことから、実際のメリットが Waymo 車両の乗車率に大きく依存していないということがわかります。
2.2.4. Waymo Driver のパフォーマンスを検証したシナリオはどのようなものですか?
衝突事故と走行について Waymo と人間の条件をそろえることは、衝突率を公平に比較するための最も重要な要素の一つです(条件を揃えることについては、質問 1.1 で詳しく説明しています)。
Waymo では、安全性の評価に役立つと考えられる 3 つのコンポーネントに初期の取り組みを集中させました。
衝突の重大度 - 警察に報告された事故から死亡まで、複数のレベルを設定。
衝突の種類(以下を参照)- Waymo が選択した分類は、最も困難な運転シナリオに注目した NHTSA の以前の調査に基づいています。
道路の種類 - 事故発生率は、一般道と高速道路に分けて算出しています。現時点では高速道路の走行距離は限られているため、一般道のみに焦点を当てています。ただし、走行距離が十分得られて統計的な比較が可能になった場合は、今後の公開情報で 2 つの道路タイプ グループを区別する予定です。
Waymo では、Waymo Driver の評価に適用する分析の視点を拡大する取り組みを積極的に進めています。ただし、一般的に、利用可能な人間の衝突データには限りがあります。Waymo は、一般公開されている衝突事故データと走行距離データを積極的に活用しています。このデータには、人間の運転者による個々の衝突事故の詳細情報は限られています。これに対し、Waymo のデータは、走行中常にモニタリングを続け、また幅広いセンサーで各衝突事故を捕捉するため、豊富な情報を含んでいます。Waymo では分析をさらに拡大するために、よりきめ細かい情報を含む新しいデータソースの利用を継続的に進め、調査を支える分析とデータをより広範なコミュニティに求めています。
2.2.5. 自動運転車が予期せず道路上で停止することによって生じる危険は、安全性影響分析で考慮されていますか?
乗客のみ(RO)で運行中の Waymo 車両が関与したすべての事故は、安全性影響分析に含まれています。したがって、Waymo 車両が道路上で停止し、その後別の車両が停止した Waymo 車両に衝突する衝突リスクは、安全性への影響に含まれます。このような停止車両の衝突も、人間のベンチマークに含まれています。
2.2.6. 衝突に関する過失の情報を公開しないのはなぜですか?
この分析には、どちらの当事者に過失があるかや Waymo の責任の有無にかかわらず、すべての衝突が含まれています。また、衝突を引き起こした過失や要因の問題は、法的に判断されます。なお、最近査読を終えたスイス再保険会社の研究で、380 万マイルを超える走行において、Waymo Driver による物的損害保険の請求頻度が人間の運転者と比較して 76% 少なく、人身傷害の請求はまったくなかったことが示されています。
出典:
Di Lillo, L., Gode, T., Zhou, X., Atzei, M., Chen, R., & Victor, T. (2024). Comparative safety performance of autonomous-and human drivers: A real-world case study of the Waymo Driver. Heliyon、10(14)。https://doi.org/10.1016/j.heliyon.2024.e34379
現在査読中の保険金請求データを使用したその後の研究では、2, 500 万マイルを超える走行において、Waymo の RO サービスでも人間と比較して同様に大幅な減少が確認されました。この新しい調査では、全体的な人間のベンチマークに加えて、「新モデル年」の車両ベンチマークも導入しています。最新の車両(2018 年から 2021 年のモデル)は、全体と比較して物的損害と人身傷害の請求率が低くなっています。Waymo では、全体との比較では物的損害の請求が 88%、人身傷害の請求が 92% 減少しました。また、新モデル年の車両で比較すると、物的損害の請求が 86%、人身傷害の請求が 90% 減少しています。これらの違いはすべて統計的に有意でした。
出典:
Di Lillo, L., Gode, T., Zhou, X., Chen, R., & Victor, T. (2024). Do Autonomous Vehicles Outperform Latest-Generation Human-Driven Vehicles? A Comparison to Waymo’s Auto Liability Insurance Claims at 25 Million Miles.
2.3. Waymo は、広範な交通安全環境にどのように役立つのですか?
2.3.1. 技術が完璧になるまで、自動運転車の導入を拡大するのを待つのはどうでしょうか?
交通安全は公衆衛生上の問題であり、持続可能な開発のための 2030 アジェンダでは、2030 年までに世界全体で交通事故による死傷者を 50% 削減するという野心的な目標が掲げられています。RAND Corporation の調査では、現在の人間とわずかに低い程度の衝突事故発生率のシステムや、人間よりもはるかに低い衝突事故発生率のシステムを導入するまでに数年待つなど、いくつかの仮定の下で自動運転システム(ADS)の導入をモデル化しました。調査の結果、早期に導入することで、より多くの被害を防ぐことができることがわかりました。
Waymo には、不合理なリスク(AUR)がない乗客のみ(ライダー オンリー、RO)システムのデプロイを最上位の目標とする安全フレームワークとセーフティ ケース アプローチがあります。このセーフティ ケースの目標は、システムの潜在的な危険をいくつかの側面から分解し、受け入れ基準を設定し、デプロイ前に主張と証拠の両方を評価することで達成されます。このプロセスは、Waymo Driver をデプロイする前に、許容できる安全性を確保することを目的としています。
2.3.2. 自動運転車は人間が運転する車よりも安全かもしれませんが、他の既存のソリューションに注目すべきではないでしょうか?
交通安全の危機に対処するために選択する技術や政策的な取り組みは、1 つだけに限る必要はありません。Waymo Driver のような自動運転車は、交通安全を向上させるために利用できる多くのツールの一つです。Waymo は、安全なシステム アプローチとビジョン ゼロに取り組んでいます。これらは、より安全な道路、より安全な速度、より安全な車両、より安全な道路利用者、より安全な事故後のケアのための複数の改善策を通じて実現されます。安全性の向上(より安全な道路への投資、安全な制限速度の設定、既存の交通法の執行、シートベルトの着用率の向上、飲酒運転の減少など)のための多くの改善も、Waymo の安全性を高めます。Waymo は、業界の多くの企業と同様に、民間資金で運営されています。誰もが社会全体として、他の安全改善策を損なうことなく、自動運転車の普及を支えることができます。
自動運転車は、人間の運転と比較した安全への影響度の大きさから、他の安全技術とは際立った機会をもたらします。たとえば、自動緊急ブレーキは、追突事故(全事故の約 4 分の 1)を約 50% 削減します。これに対し、Waymo Driver は、現在の予防安全技術では事故を大幅に減らすことができていない交差点や交通弱者の事故を含め、あらゆる事故モードで、負傷者が報告された事故を約 80% 削減しています。
2.3.3. 自律走行車はセーフ システム アプローチにどのように適合しますか?
世界のビジョン ゼロ運動に基づくセーフ システム アプローチは、道路輸送システムにおける重傷者と死亡者をゼロにすることを目指す体系的な手法です。Waymo の自動運転車は、ビジョン ゼロの原則に従うように設計されているため、セーフ システムのツールキットにおいて貴重なツールとなります。Waymo では、すべての乗客にシートベルトの着用を義務付けています。Waymo は制限速度を遵守するように設計されており、最新のパッシブ セーフティ機能を備えた車両を使用しています。
2.4. 共有データ自体についてはどうでしょうか?
2.4.1. データはどれくらいの頻度で更新されていますか?
この分析では、他の研究者が結果を再現できるように、一般公開されたデータ(NHTSA の常設一般命令(SGO)に基づいて提出された Waymo の衝突報告書)を使用しています。このウェブページに表示されているデータは、NHTSA SGO の報告スケジュールに沿って、定期的に更新されます。
新しいデータの公開に加えて、Waymo RO(乗客のみ)サービスと人間のベンチマークの比較を行う際に使用する手法についても更新することがあります。過去のデータから安全性への影響を調べるベスト プラクティスは、日々進化しています。手法を変更する場合、変更内容に加え、それがもたらす結果やデータ解釈への影響についてもお知らせします。詳細は、ダウンロード セクションのリリースノートをご参照ください。
2.4.2. ダウンロードできる Waymo SGO データに、衝突事故の日付、地域、郵便番号が含まれているのはなぜですか?
この情報は事故を分析し、理解するために重要ですが、NHTSA SGO では入手できないためです。2025 年 6 月以降のデータには郵便番号が含まれていません。これは、このフィールドが NHTSA SGO レポートフォームから削除されたためです(SGO 修正第 3 項 を参照)。郵便番号のフィールドは、2025 年 9 月に SGO レポート フォームに再び追加されました。9 月以降の SGO の事故報告書のデータ ダウンロード ファイルには、郵便番号が含まれています。
データをダウンロード
地域ごとの走行距離(マイル)
サンフランシスコ、フェニックス、ロサンゼルス、オースティンでの合計走行距離(マイル、2024 年 12 月まで)
CSV をダウンロードSGO の ID と属するグループ情報付きの衝突データ
2024 年 12 月までの警察への届け出、負傷の発生、エアバッグ作動、デルタ V が 1 マイル/時未満、その他の関連衝突情報(日付、地域、郵便番号)
CSV をダウンロード結果と地域別の衝突数およびベンチマークとの比較
結果や地域ごとに集約(2024 年 12 月まで)
CSV をダウンロードベンチマークと Waymo 無人運転走行距離の地理的分布
2024 年 12 月までの S2 セルで報告された、異なる結果レベルの人間のベンチマーク衝突数、人間の車両走行距離(VMT)、Waymo の無人運転走行距離。この情報は、動的なベンチマーク調整を再現するために利用できます。
CSV をダウンロードリリースノート
データハブで使用されているデータや手法の変更に関する説明、過去のデータへのリンク、データ辞書。
PDF をダウンロード