Senario
Syarikat SaaS hendak memindahkan pangkalan data 500GB dari premis ke awan dalam masa 2 jam. Sandaran MySQL 8.0 (InnoDB) menggunakan mysqldump mengambil >3 jam, pemulihan tidak menentu. Sandaran PostgreSQL 15 dengan pg_dump mengambil 2.8 jam, pemulihan melampaui 4 jam. Melanggar SLA.
Gejala
- MySQL: Sandaran
mysqldump3.5 jam, pemulihan 4 jam; Sandaran XtraBackup 1.5 jam, tetapi pemulihan menyebabkan I/O cakera tinggi mengganggu aplikasi. - PostgreSQL: Sandaran
pg_dump2.8 jam, pemulihan lambat akibat main semula WAL; Sandaranpg_basebackup1.2 jam, tetapi pemulihan perlu main WAL secara manual.
Diagnosis
MySQL
- Bottleneck sandaran: Semak jika
mysqldumpmenggunakan--single-transaction(elak kunci jadual) dan--quick(baris demi baris). Gunakanperf topuntuk kenal pasti CPU dibelanjakan untuk mampatan (gzip lalai). - Bottleneck pemulihan: Tunggu I/O tinggi akibat pelaksanaan satu thread
mysql < dump.sqldan cakera tidak berjalur.
PostgreSQL
- Sandaran:
pg_dumplalai serial; gunakan-juntuk selari. Semakshared_buffersdanwork_mem. - Pemulihan:
pg_restorejuga serial; tentukan-j. Arkib WAL tidak betul menyebabkan main semula WAL berlebihan.
Arahan
Sandaran Cepat MySQL dengan XtraBackup
xtrabackup --backup --parallel=4 --compress --compress-threads=4 --target-dir=/backup/mysql/full
Pemulihan MySQL
xtrabackup --prepare --target-dir=/backup/mysql/full
xtrabackup --copy-back --target-dir=/backup/mysql/full
Sandaran Selari PostgreSQL
pg_dump -j 4 -Fd -f /backup/pg/dump mydb
Pemulihan Selari PostgreSQL
pg_restore -j 4 -d mydb /backup/pg/dump
Kawalan Risiko
- Periksa ruang cakera sebelum sandaran untuk elak isian penuh.
- Gunakan
--single-transactionatau--lock-wait-timeoutpada pengeluaran untuk elak menunggu lama. - Jangan terus pulihkan ke pengeluaran; uji pada contoh pementasan dahulu.
- Buat checksum fail sandaran dan lakukan latihan pemulihan berkala.
Penggulungan
- Jika sandaran gagal, segera guna sandaran terakhir yang berjaya.
- MySQL: Guna sandaran inkremental XtraBackup (
--incremental-basedir) untuk gulung balik. - PostgreSQL: Guna PITR untuk pulih ke titik masa tertentu.
Pengesahan
- Jalankan checksum aras jadual:
MySQL:
CHECKSUM TABLE table_name;PostgreSQL: Gunapg_surgery(berhati-hati) atau alat pengesahan hash tersuai. - Jalankan pertanyaan penting, banding kiraan baris dan ringkasan perniagaan.
- Pantau log aplikasi untuk ralat kunci pendua atau data hilang.
Bila Kemukakan Tiket OpsGlobal
- Tempoh sandaran secara konsisten melebihi tetingkap >50%.
- Pemulihan gagal atau ketidakselarasan data tidak dapat diselesaikan secara dalaman.
- Perlu tala strategi sandaran (algoritma mampatan, selari, dsb.).
- Bottleneck I/O cakera atau rangkaian menjejaskan beban kerja lain dan memerlukan sokongan infrastruktur.
Panduan ini hanya rujukan teknikal. Sentiasa ikut proses pengurusan perubahan anda. Untuk bantuan pakar, hubungi OpsGlobal.
Senario Penggunaan
Sesuai untuk pasukan yang menyelesaikan isu Database dan memerlukan aliran kerja yang jelas.
Latar Belakang Masalah
Mendalami prestasi sandaran dan pemulihan MySQL dan PostgreSQL, termasuk diagnosis, pengoptimuman, kawalan risiko, dan bila perlu mengemukakan tiket OpsGlobal.
Langkah Penyelesaian
Sahkan impak dan perubahan terkini, kumpul log, konfigurasi dan metrik, kemudian baiki mengikut risiko.
Contoh Arahan
Gantikan contoh dengan nama sumber sebenar dan simpan kata laluan, token atau kunci dalam pembolehubah persekitaran.
Risiko
Sebelum operasi produksi, semak sandaran, akses, tetingkap perubahan dan pelan rollback.
Pelan Rollback
Simpan konfigurasi dan versi asal; rollback konfigurasi, imej atau perubahan pangkalan data jika metrik tidak normal.
Senarai Serahan
Rekod punca isu, arahan penting, langkah pembaikan, hasil pengesahan dan cadangan susulan.
Perlu bantuan isu teknikal serupa?
Jika pelayan, Kubernetes, Docker, CI/CD, pangkalan data atau pemantauan anda bermasalah, hantar log dan konfigurasi untuk diagnosis jauh.