Bagaimana melakukan studi in- mendalam dengan Claude Dynamic Wordflow

Dalam tiga tahun terakhir, saya telah melakukan penelitian industri dengan dukungan AI, dan saya telah membangun serangkaian keterampilan dan sistem bantu untuk memilah penyaringan informasi, rangkuman, koneksi, validasi, seditasi。

Tidak sampai seminggu berlalu alur kerja dinamis dari Claude Code bahwa arti sebenarnya dari frase "orang tidak melawan saat-saat hebat"。

PIKIRKAN LAGI: APA KEDALAMAN PENELITIAN YANG ORANG-ORANG DI USIA AI HARUS LAKUKAN DAN BAGAIMANA MEMBANGUN HUBUNGAN KOMPLEMENTARY ANTARA SAYA DAN AI。

I. Mulai dengan perangkap penelitian

PENELITIAN TEKNIS ADALAH, SEBENARNYA, JEBAKAN (BAIK UNTUK ORANG DAN UNTUK AI) DAN, SETELAH SEMUA, BANYAK INFORMASI YANG DITERIMA DARI AWAL PENELITIAN, DENGAN JUMLAH SUDUT PANDANG YANG MENINGKAT DAN SEMAKIN JELAS KESIMPULAN. JADI INILAH SAATNYA UNTUK MEMAHAMI TUJUAN UNTUK KEMBALI SENDIRI。

DAN ITULAH MENGAPA AI TIDAK CUKUP BAIK, KARENA DARI SUDUT PANDANG PERHATIAN DAN ASOSIASIDia akan lebih terjebak daripada manusia dalam jumlah informasi saat ini dan lemah dalam benar-benar berharga koneksi perbatasan。

Tentu saja, Al cukup baik untuk dapat melakukan tugas menemukan, meringkas, dan hanya menghindari hilangnya detail。

meskipun saya belum memberikan banyak publisitas dalam enam bulan terakhir, saya telah mencari dan meneliti di hampir semua bidang utama industri, dan masukan ini didukung oleh sistem penelitian saya sendiri。

Dan di hadapan Claude Code minggu lalu di telepon, Dynamic Workflow, saya ingin turun dengan satu sama lain dan melihat apakah kekuatan bakunya di luar saya。

Apa itu Dynamic Workflow

Garis inti dari Workflow Dynamic adalah:SEBELUM SEBUAH MISI DILAKUKAN, AI AKAN SECARA OTOMATIS MERANCANG ALIRAN KERJA APA YANG HARUS DIGUNAKAN UNTUK TUGAS INI DAN KEMUDIAN MEMULAI EKSEKUSI。

Hal ini pada dasarnya berbeda dari "model rencana" dan "keterampilan" yang biasa kita gunakan. Model rencana adalah untuk meruntuhkan tugas, tetapi tidak selalu sesuai dengan aliran kerja yang wajar. Hal ini dimungkinkan untuk menambahkan indikator penerimaan (yang penting untuk Penelitian) dengan petunjuk Anda, dan Anda hanya akan lebih siap untuk mengatur beberapa aturan harness jika Anda memilikinya。

Namun, proses dinamis mengalir secara otomatis menggabungkan logika penerimaan, konstriksi hasil, dan konfrontasi untuk memverifikasi hal-hal ini。

pemicu sederhana, langsung dalam penelitian cc / deep-& nbsp;ini akan cukup untuk menyediakan beberapa penelitian template dan informasi akses, dan jika kemampuan untuk menggunakan aliran kerja dinamis saja adalah petunjuk atau ultracode langsung, sebelum digunakan, token mengkonsumsi sekitar puluhan kali lebih banyak。

III. Inlined enam mode arus kerja

bagian bawah alur kerja dinamis adalah enam pola pergerakan inti secara resmi dirangkum, itulah sebabnya lebih kuat daripada dialog / agen / keterampilan。

Bahkan, hanya ada dua masalah utama di belakang enam model: bagaimana bisa tugas itu rusak? Bagaimana rasanya。

3.1 & nbsp; mode rute (Klasik -And-Act)

tugas ini pertama kali diidentifikasi oleh seorang agen dan kemudian didistribusikan ke yang paling sesuai khusus & nbsp;agen & nbsp;Lakukan. Logika intinya adalah:Logika seleksi rute, tidak paralel atau iteratif. Satu misi hanya mengikuti satu jalan, dan jalur lain sama sekali tidak-implementasi。

sebagai contoh, saya bisa mulai dengan tiga peran subagen preset: analisis antent analisis data yang ketat, keluaran yang baik dalam menulis antent, tantangan yang didedikasikan untuk menemukan celah. mari router menilai siapa sub- tugas saat ini, bukannya membiarkan satu pak individu。

nilai dari model ini adalah bahwa itu tepat dan ekonomis, dan petunjuk setiap agen dapat sangat independen dan bebas dari target lain, mengarah ke eksplorasi kedalaman vertikal. token memiliki konsumsi terendah, respon tercepat. garis tanggung jawab sangat jelas。

Ada juga kekurangan yang signifikan dan kapasitas lemah untuk menangani tugas yang mengaburkan batas (seperti "baik masalah teknis dan akun"。

3,2 Pecah asummation (Fan- out & amp; Merge)

INI JUGA MODEL SAYA YANG PALING UMUM, DAN LOGIKA INTI PARALEL DITAMBAH KONSOLIDASI. TUGAS-TUGAS DIBAGI MENJADI N TERPISAH SUB- TUGAS, BERJALAN SECARA BERSAMAAN DAN MENGKONSOLIDASIKAN MEREKA SETELAH SEMUA SELESAI。

keuntungan adalah kecepatan dan isolasi. waktu total adalah tentang penyerahan paling lambat, bukan jumlah dari semua. setiap penyerahan adalah subjek independen, tanpa gangguan, dan tidak mencemari pengiriman lainnya karena kebisingan dari satu penyerahan。

Kelemahan adalah bahwa biaya token adalah tiga kali jumlah serial, dan lapisan konsolidasi itu sendiri sulit - bagaimana mengintegrasikan keluaran dengan struktur N jalan yang tidak konsisten adalah tantangan desain. Pembagian sub- tugas yang buruk menyebabkan kelalaian atau duplikasi cakupan。

3,3 & nbsp; Kontra-validasi (Verifikasi Adverral)

Logika intinya adalah:Uji, multiple & nbsp untuk kesimpulan yang sama;agen & nbsp;Dari sudut pandang "menyangkal", itu lebih dari setengah suara。

Keuntungan adalah bahwa, karena Verifier tidak tahu apa yang Walker pikirkan, itu hanya melihat hasil, dan struktural menghilangkan bias evaluasi diri dalam "Biarkan model memeriksa kode yang ia tulis"。

POLA INI MEMECAHKAN MASALAH YANG LAMA: KITA SERING BERBICARA DENGAN AI SECARA LISAN, TAPI AI CENDERUNG MENANGGAPI EKSPEKTASI ANDA, DAN MUDAH UNTUK "MENGENALI BIAS". DENGAN MENGKONFRONTASI VALIDASI, MEMAKSA AI UNTUK MENCARI CONTOH TERBALIK, UNTUK MENGUJINYA BERDASARKAN DATA DAN PERCOBAAN, DARIPADA PADA DIRIMU SENDIRI。

Tapi, untuk memverifikasi ini, jika ia memberikan penilaian yang salah, dia akan membawanya ke Verifier. Jadi pilihan yang disukai didasarkan pada fakta-fakta yang dapat direproduksi daripada pada sudut pandang。

AKU HANYA BERCANDA UNTUK MENGATAKAN BAHWA JIKA ANDA MEMBIARKAN AI MENEMUKAN MASALAH, DIA BISA MELAKUKANNYA SEPANJANG WAKTU, SEHINGGA ANDA HARUS MEMBATASI BATAS-BATAS DI MANA IA MENEMUKAN MASALAH。

3,4 Generasi dan Penyaringan (Hasilkan & amp; Filter)

Logika intinya adalah:Ini akan menyebar, kemudian akan turunaku tidak tahu. pertama, anda sengaja membuat jumlah kandidat yang berlebihan, kemudian anda fase itu dengan rubric, dan anda terus output percaya diri tinggi。

Alih-alih memiliki seorang agen output jawaban "baik", lebih baik untuk menghasilkan sepuluh, kemudian filter dengan lapisan sertifikasi. Keuntungannya terletak pada keragaman. Beberapa Generator dapat menggunakan strategi yang berbeda, petunjuk yang berbeda, solusi keluaran yang secara artifisial sulit diantisipasi, dan langkah penyaringan memungkinkan konsentrasi yang tinggi dari kualitas keluaran akhir。

Kelemahannya adalah massa rubric Filter secara langsung menentukan efek akhir, dan kesalahan desain rubric adalah akhir dari seluruh proses

Skenario yang tepat adalah situasi di mana jawaban yang benar tidak diketahui sebelumnya, di mana keuntungan perlu ditarik dari berbagai kemungkinan, dan di mana ada kebutuhan yang jelas untuk keragaman。

Fanout dan Syntheretch sama seperti permukaan"Lebih banyak jalan dalam paralel, keluaran tunggal" adalah yang paling mudah untuk membingungkan。

Perbedaan kuncinya adalah..Intention(a) Setiap jalan di Fanout berurusan dengan bagian-bagian yang berbeda dari misi, hasil yang komplement dan semua jalan berkontribusi untuk merger; setiap jalan di Fanout berurusan dengan tugas yang sama, hasil menjadi kompetisi dan sebagian besar merger dibuang. Yang pertama adalah teka-teki, kedua adalah kontes kecantikan。

3.5 Turnamen

Logika inti kompetitif phase- keluar. Para agen N melakukan hal yang sama dengan mereka sendiri, dengan mengadopsi & nbsp; pairwise & nbsp; dengan membandingkan fase- round-out, akhirnya memilih solusi terbaik. & nbsp;

YANG INI SAYA LAKUKAN SECARA MANUAL -- KODE YANG SAMA MENGUBAH DUA ATAU TIGA VERSI, DAN MEMBUAT AI LEBIH BAIK DARIPADA YANG BENAR. SEKARANG DAPAT DIATUR LANGSUNG DALAM ALUR KERJA。

KEUNTUNGAN ADALAH UNTUK MENILAI STABILITAS. DUA KONTRAS ("A" DAN "B" YANG LEBIH BAIK? ") JAUH LEBIH STABIL DARIPADA RATING ABSOLUT (" A "RATING), KARENA MEREKA TIDAK TERMASUK PERGESERAN KRITERIA RATING. HASILNYA TELAH BEBERAPA PUTARAN KOMPETISI DAN PEMENANG TERAKHIR MEMILIKI KREDIBILITAS TINGGI。

Mirip dengan Generatic Filter: Keduanya dipilih dari beberapa kandidat. Perbedaan kuncinya adalah mekanisme pemilihan: Turnamen, dengan perbandingan dua dan dua, adalah "kandidat pesaing". Ketika rubric sulit untuk mengukur dan menilai adalah oleh alam relatif, lebih dapat diandalkan。

3,6 Loop

Logika intinya adalah:Dari Adaptasi- Usaha terus-menerus untuk mengumpulkan informasi palsu, melengkapi konteks, sampai kondisi penerimaan terpenuhi。

INI PADA DASARNYA MELAWAN ACAK-ACAKAN AI: COBA LAGI, SELALU BERTEMU DENGAN HASIL YANG LEBIH BAIK. TAPI AKAN LEBIH MATANG UNTUK MENGGABUNGKAN SERTIFIKASI KONFRONTASI DAN MEMUNGKINKAN SETIAP SIKLUS UNTUK DIIMPLEMENTASIKAN DENGAN INFORMASI LEBIH LANJUT, DARIPADA HANYA ACAK。

Keuntungan terletak pada kemampuan untuk menangani tugas dengan beban kerja yang tidak diketahui. Lima model lainnya menganggap bahwa batas misi tetap, & nbsp; Loop Sampai Selesai dan nbsp; satu-satunya yang dapat menangani "tidak tahu berapa banyak putaran"

kelemahan adalah risiko potensial kehilangan kontrol - kondisi berhenti tidak baik dirancang untuk beredar tanpa batas. setiap putaran anen adalah konteks yang sama sekali baru yang tidak dapat mengumpulkan keadaan simpang-silangkan (kecuali ditulis secara jelas dalam berkas)。

IV. saya sendiri skull dan Batal OFFIAL

saya merancang satu set & nbsp sendiri sebelum pekerjaan dinamis keluar; penelitian mendalam & nbsp; keterampilanku mungkin ini:

Hanya satu pesan sederhana (misalnya fitur baru pada proyek)
BIARKAN PENCARIAN AL SEMUA INFORMASI YANG RELEVAN: BERKAS RESMI, KODE SUMBER, OPINI PASAR
Kompres informasi ke ringkasan berarti
multiple agent roles to counteranalisis and generate reports
secara otomatis berat karena laju pengulangan tinggi dari beberapa isi agen

Butuh beberapa saat untuk menemukan berguna。Tapi memiliki kelemahan mendasar: kurangnya pertumbuhan goal- berorientasi。

dan berkali-kali, bahkan jika ada kelas berat tahap lima, pada titik ini, dia sering menghapus informasi berharga, dan jika tidak cukup berat, sangat mudah untuk memberikan anda teks panjang, tapi tidak memberitahu anda, "apa hubungannya ini dengan anda?"。

namun, untuk "keputusan-membuat" tujuan, inilah sebabnya banyak keterampilan berhenti pada penelitian itu sendiri, dengan 80 poin, tetapi kurang dari yang paling kritis 20 poin。

SEJAUH INI, SETELAH MENYELESAIKAN STUDI INI, AI PERLU MELANJUTKAN 10 REFLEKSI DAN DIALOG UNTUK MENCAPAI KESIMPULAN YANG MEMUASKAN DAN MENYELURUH。

Apa pekerjaan resmi yang dinamis lakukan

Melalui beberapa percobaan dengan misi penelitian yang kompleks minggu ini, saya menemukan bahwa Claude Code 's built-in & nbsp; Deep Research & nbsp; Workstream (bukan hanya keterampilan, tapi modul kompile tertanam di cc) memiliki beberapa link kunci untuk keterampilan saya sendiri:

Masalah PembongkaranIni tidak hanya mulai mencari, tetapi mulai dengan mengajukan pertanyaan dan melanggar pertanyaan saya ke sub- pertanyaan: apa yang Anda benar-benar ingin tahu? Apa hubungannya denganmu? Dimensi apa yang layak ditelusuri? Aku pernah melakukan ini sebelumnya。
Penilaian kredibilitasASSESSING PER SEPOTONG INFORMASI UNTUK SUMPAH PALSU, RATING OTORITER MIRIP DENGAN YANG DITEMUKAN DALAM SEOUL TRADISIONAL - APAKAH SUMBER KREDIBEL? BERAPA BANYAK REFERENSI? ITULAH YANG SAYA TIDAK BERHARAP UNTUK MENAMBAHKAN。
Hapus silang daripada gabungan rata-rataaku biasanya mengambil semua kesimpulan rata-rata, jadi berkasnya besar. dinamis mengalir memberikan suara pada setiap kesimpulan, dengan suara yang tidak cukup yang dihapus dan tidak hanya bergabung。
Keluaran Target terorientasilaporan terakhir bukan tumpukan informasi, tapi penilaian dan proposal sekitar tujuan asli anda. kunci untuk ini adalah kemampuan pra-set untuk memindahkan beberapa anak, dan alasan mengapa saya telah terampil sebelumnya adalah bahwa itu mudah bagi saya untuk tidak memiliki orientasi berorientasi akhir, karena setelah massa informasi, saya tidak yakin apa yang saya cariTolak bobot perintahAku tidak tahu。

Apa mekanisme ini dipecahkan

INI TENTANG BEBERAPA PERTANYAAN KHAS TENTANG AI MELAKUKAN MISI PANJANG:

Drift targetMisi dimulai dengan baik, tidak tahu apa yang harus dilakukan di tengah, dan berakhir dengan irama baru - pelajaran bagi manusia. Semakin lama misinya, semakin jelas。

Berhenti lebih awalMENJALANKAN KERAS, AL BERPIKIR DIA DILAKUKAN, DAN IA BERHENTI, DAN PADA KENYATAANNYA TIDAK ADA PENERIMAAN。

Polusi konteks"individual angents melakukan tugas kompleks, dan sejumlah besar pre- posisi kompress ruang eksekusi berikutnya. cara yang lebih baik untuk menjaga pre- prompt dalam beberapa k dan menyebarkan konteks di antara beberapa pihak。

Alas keluaranAI CENDERUNG MENGIKUTI HARAPAN ANDA, DAN LEBIH MUDAH UNTUK MENGAJUKAN PERTANYAAN LISAN UNTUK MEMICUNYA。

SISTEM KERJA DINAMIS MENGATASI KEEMPAT ISU INI DENGAN CARA YANG TERSTRUKTUR: INDIKATOR PENERIMAAN OTOMATIS UNTUK MENCEGAH PENGHENTIAN PREMATUR; ISOLASI PARALEL DALAM KONTEKS; COUNTER-VALIDASI DISSET KELUARAN BIAS; DAN MEMBONGKAR LAPISAN KENDALA AI MEMAHAMI TARGET SEBELUM AKSI。

Ringkasan

Akhirnya, sebagai peneliti permanen, mekanisme baru untuk CCC terkesan oleh fakta bahwa enam model tertanam di dalamnya - seleksi rute, pemisahan, anti- sertifikasi, penyaringan, kampanye kejuaraan, sirkulasi Loop - mencakup persyaratan gerakan dari misi penelitian paling kompleks。

jadi saya tidak perlu merancang gerakan marah secara manual, dan saya tidak perlu melakukan pemberat dan penyeimbangan diri sendiri, yang semua diprogram ke dalam aliran kerja itu sendiri。

Dan dia sangat baik ditempatkan untuk berpikir tentang kurangnya informasi dan eksplorasi masalah perkembangan, karena pemisahan gerakan doagen alami ditambah tujuan misi telah mengangkat dia lagi dalam hal interoperability, yang, tiga tahun yang lalu, AI telah dilakukan dengan baik dalam pengalamatan hanya sangat jelas dan kecil, tetapi kualitas nyata Al harus universal, yang mengapa saingan, dari kode sederhana ke Agen nyata, ditangani masalah dari keadaan solid ke adaptasi。

Jadi, Dynamic Workflow, aliran kerja dinamis tidak "lebih pintar satu arah percakapan", itu hanya..Proses penelitian itu sendiri terstruktur。

Aku harus memulai banyak dialog independen, dan sekarang aku turun ke tiga sampai empat. Meskipun sesuai dengan konsumsi Token telah meningkat puluhan kali。

Lalu kenapa tiga atau empat kali lagi& nbsp, saya pikir akar penyebab dari perbedaan permintaan ini。

Nomor satu:Keparahan dari mekanisme sertifikasiSAYA MELAKUKAN PENELITIAN TERUTAMA PADA TEKNOLOGI BARU DALAM RANTAI BLOK, DAN BANYAK HAL, DOKUMEN RESMI TERTINGGAL, DENGAN LEBIH REFERENSI UNTUK KODE SUMBER TERBUKA, TRANSAKSI RANTAI, DLL., SEMENTARA AI DEFAULT DIDASARKAN PADA DOKUMEN RESMI, TIDAK PADA VERIFIKASI FAKTUAL。

KeduaPenuh lintas perbatasan dalam berpikirIni, meskipun mungkin untuk berpikir tentang masalah yang sama melalui preset working- flow (subAgent, yang predefined berbagai dimensi). Tapi Al bagus pada model pemikiran arus utama, yang tidak cukup untuk yang baru, sangat dalam dan kurang data。

Nomor tiga:Solusi desain dan validasiARTI DARI SOLUSINYA ADALAH BUKAN UNTUK MENYAJIKANNYA, TAPI UNTUK MEMVALIDASINYA, MENDUKUNGNYA, UNTUK BERGANTUNG PADA PENGUKURAN MEKANISME YANG ADA, MASUKAN DAN BIAYA, DAN, TENTU SAJA, UNTUK MENGAJARKAN AI LEBIH BAIK, MESKIPUN INI BERTENTANGAN DENGAN INTEROPERABILITAS。

Dan akhirnyaInformasi ekstrim pengayaanIni adalah tentang kembali ke tingkat pemahaman dari penonton pesan, di mana beberapa orang tidak memiliki latar belakang dan membutuhkan gambar Anda, sementara orang lain membutuhkan kata-kata Anda untuk membuatnya terkesan。

Bagaimana melakukan studi in- mendalam dengan Claude Dynamic Wordflow

I. Mulai dengan perangkap penelitian

Apa itu Dynamic Workflow

III. Inlined enam mode arus kerja

3.1 & nbsp; mode rute (Klasik -And-Act)

3,2 Pecah asummation (Fan- out & amp; Merge)

3,3 & nbsp; Kontra-validasi (Verifikasi Adverral)

3,4 Generasi dan Penyaringan (Hasilkan & amp; Filter)

3.5 Turnamen

3,6 Loop

IV. saya sendiri skull dan Batal OFFIAL

Apa pekerjaan resmi yang dinamis lakukan

Apa mekanisme ini dipecahkan

Ringkasan

相关文章

深入解读：SpaceX IPO值得以每股$135投资吗？

当推理成为稀缺资源，价值由谁捕获

产业观察：从 Bitget CFD最新版本迭代，看加密衍生品平台的「场景化」与「去摩擦化」趋势

产业观察：从Bitget CFD最新版本迭代，看加密衍生品平台的“场景化”与“去摩擦化”趋势

产品

法律与支持

友情链接