[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [Fwd: Re: çift kayıtları bulma]



Merhaba,

* Zeki Çatav [2006-07-05 15:10:52+0300]
> Bu yöntem ile belli bir aralığı kontrol edip seçim yapamadım. Tek değişkene göre

"Aralık" dediğinizden ben mesela "3.ncü ve 15.nci sütunlar arası"nı
anlıyorum.  Eğer belirli bir sütundaki (alandaki) değer aralığını
kastediyorsanız o farklı.  Bu (basit) betik içeriğin ayrıntılarıyla
ilgilenmez, sadece kayıtların (karakter bazlı bir karşılaştırmayla)
mükerrer olup olmadığına bakar.

> seçim yaptı ama bu yöntemle dosya fazla kırpıldı. 1007 kayıt içeren bir dosyayı 
> bu yöntemle "dosya numarası" değişkenine göre tarayınca 402 kayda
> indirgedi. Oysa ilk önerdiğiniz (dünkü e-postanız) yöntemde aynı alana
> göre tarama 758 kayda indiriyordu.

Evet, hata yapmışım.  Ekteki sürümde bu hatanın olmaması lazım.

> Aynı dosyayı .csv formatına çevirip Serdar Aytekin'in önerdiği yöntemle
> "cat aaanv.csv | sort -t' ' | uniq -w10 > dene1.txt" işleyince 751 kayıt
> ile sonuçlanıyor. -w10 sadece dosya numarası kadar karaktere karşılık
> geliyor.
> Ayrıca bugünkü perl betiği değişken adlarını karışık sıralıyor, dünkü
> numarasız ama doğru sırayla dökmekteydi.

Düzelttim.

> Son perl betiği çıktısı ------------------------------------
> ..................................................
> Malformed UTF-8 character (byte 0xfe) at dbf_uniq2.pl line 54.
  ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

Bu uyarılar zararsız.  Bazı iletiler için UTF-8 kodlu Türkçe karakterler
kullanmıştım.  Bu karakterler posta iletimi sırasında ISO'ya dönüştürülmüş
görünüyor.  Yenisini gzip korumalı olarak gönderiyorum.  Yine sorun çıkarsa
göz ardı edin.

> dbf formatında perl ile işlem yapmak ile csv formatında bash ile işlem
> yapmak öneriniz nedir?

Bir kereye has bir işlem ise bu, en basit (ve sizin tarafınızdan müdahale
edilebilir) olanını, yani Serdar'ın önerdiği yöntemi tercih edebilirsiniz.
Ama böyle başka bir çok dosya varsa ve gelecekte bu durumla tekrar
karşılaşma ihtimaliniz varsa dbf üzerinden gitmek daha uygun olabilir.

-- 
roktas

Attachment: dbf_uniq.pl.gz
Description: Binary data


Reply to: