[C#] XML에서 원하는 데이터 검색하기

C#에서 XML 데이터를 처리해야할 기능이 필요하여 이리 저리 찾은 내용을 정리한 글입니다. 먼저 사용할 XML 데이터는 아래와 같다고 하겠습니다.


    
        
            The Autobiography of Benjamin Franklin
            
                Benjamin
                Franklin
            
            8.99
        
        
            The Confidence Man
            
                Herman
                Melville
            
            11.99
        
        
            The Gorgias
            
                Plato
            
            9.99
        

가장 먼저 위의 XML 데이터를 쉽게 조회하기 위해 트리 형태로 구성하기 위한 준비 코드는 다음과 같습니다.

XmlTextReader reader = new XmlTextReader("books.xml");
XmlDocument xdoc = new XmlDocument();
xdoc.Load(reader);

자.. 이제 부터 원하는 데이터를 얻어 낼 수 있는데요. 다음과 같이 네 가지의 목표를 정하고 목표를 이루어 나가 보겠습니다.

  1. 은 몇개인가?
  2. 두번째 의의 값은 무엇인가?
  3. 두번째 의 속성 genre의 값은 무엇인가?
  4. 두번째 의 의 의 값은 무엇인가?

먼저 답은 다음과 같습니다.

  1. 3개
  2. The Confidence Man
  3. novel
  4. Herman

위의 답을 내어 내기 위한 코드를 하나 하나 제시해 보면 다음과 같습니다.

“은 몇개인가?”에 대한 코드

XmlNodeList bookNodes = xdoc.DocumentElement.SelectNodes("book");
Console.WriteLine(" 노드의 개수: " + bookNodes.Count);

“두번째 의의 값은 무엇인가?”에 대한 코드

XmlNode titleNode = bookNodes[1].SelectSingleNode("title");
Console.WriteLine("두번째 의의 값은: " + titleNode.InnerText);

“두번째 의 속성 genre의 값은 무엇인가?”에 대한 코드

String genre = bookNodes[1].Attributes["genre"].Value;
Console.WriteLine(genre);

끝으로.. “두번째 의 의 의 값은 무엇인가?”에 대한 코드

String firstName = bookNodes[1].SelectSingleNode("author")
    .SelectSingleNode("first-name").InnerText;
Console.WriteLine(firstName);

끝으로 이보다 효율적인 방법이 존재하겠지요? 알고 계시다면 한수 부탁드립니다!

[C#] C++의 multimap 컨테이너

C++의 STL에 multimap이라는 컨테이너가 존재합니다. 이 컨테이너는 키(key)와 값(value)의 쌍으로 구성된 요소를 저장하고 있으며 key 값으로 정렬 되어 있습니다. 여기서 중요한 것은 이 키가 유일하지 않다는 점입니다. 즉 중복될 수 있다는 점인데요. 이러한 C++의 multimap의 성질을 갖는 컨터이너가 C#에는 기본적으로 존재하지 않습니다. 해서 이러한 컨터이너를 직접 개발자가 만들어 써야 하는데.. 다행히 C#에서 어렵지 않게 구현할 수 있습니다.

C#에서 제공하는 컨테이너(NET에서는 컬렉션(Collection)이라는 다른 이름을 사용) 중에 List와 SortedDictionary 컬렉션을 조합하여 우리가 원하는 C++의 multimap 컨테이너를 만들 수 있습니다. 아래는 이렇게 구현한 컬렉션으로 클래스 이름을 .NET의 이름에 맞게 MultiSortedDictionary라고 지었습니다.

class MultiSortedDictionary;
{
    private SortedDictionary dic_ = null;

    public MultiSortedDictionary() 
    {
        dic_ = new SortedDictionary();
    }

    public MultiSortedDictionary(IComparer comparer)
    {
        dic_ = new SortedDictionary(comparer);
    }

    public void Add(Key key, Value value)
    {
        List list = null;

        if(dic_.TryGetValue(key, out list))
        {
            list.Add(value);
        }
        else
        {
            list = new List();
            list.Add(value);
            dic_.Add(key, list);
        }
    }

    public bool ContainsKey(Key key)
    {
        return dic_.ContainsKey(key);
    }

    public List this[Key key]
    {
        get
        {
            List list = null;
            if (!dic_.TryGetValue(key, out list))
            {
                list = new List();
                dic_.Add(key, list);
            }

            return list;
        }
    }

    public IEnumerable keys
    {
        get
        {
            return dic_.Keys;
        }
    }
}

MultiSortedDictionary 클래스의 코드가 그리 길지 않습니다. C#은 이미 매우 잘 만들어진 컬렉션 클래스를 가지고 있으므로 이들을 조합하여 쉽게 구현할 수 있었기 때문입니다. 이제 MultiSortedDictionary 클래스를 사용해 보겠습니다.

먼저 요소를 추가합니다. 요소의 키는 정수(int)이고 값(value)은 POINT라는 사용자 정의 구조체로 하겠습니다. 먼저 POINT 타입의 구조체는 아래와 같습니다.

struct POINT
{
    public int x;
    public int y;

    public POINT(int x, int y) 
    {
        this.x = x;
        this.y = y;
    }

    override public string ToString()
    {
        return String.Format("({0:D},{1:D})", x, y);
    }
}

이제 MuiltiSortedDictionary 클래스의 인스턴스를 생성하고 몇가지 요소를 추가하는 코드를 작성해 보면 아래와 같습니다.

static void Main(string[] args)
{
    MultiSortedDictionary msd_ 
        = new MultiSortedDictionary();

    POINT pt1 = new POINT(100, 100);
    POINT pt2 = new POINT(100, 200);
    POINT pt3 = new POINT(100, 300);
    POINT pt4 = new POINT(100, 100);
    POINT pt5 = new POINT(100, 200);
    POINT pt6 = new POINT(100, 300);

    msd_.Add(30, pt6);
    msd_.Add(20, pt4);
    msd_.Add(10, pt1);
    msd_.Add(10, pt3);
    msd_.Add(20, pt5);
    msd_.Add(10, pt2);

실제로 키에 대해 정렬이 되어 있는지를 살펴보기 위해 임의로 요소를 추가할때 키의 순서를 정렬되지 않은 키값 순서로 추가하고 있습니다. 실제로 키 값이 정렬되어 있는지 파악하는 코드는 아래와 같습니다.

IEnumerator iter = msd_.keys.GetEnumerator();
iter.Reset();
Console.Write("key list : ");
while(iter.MoveNext()) 
{
    Console.Write(iter.Current + " ");
}
Console.WriteLine();

실행 결과는 아래와 같습니다.

사용자 삽입 이미지
결과를 보면 요소에 대한 키의 순서가 옳바르게 정렬되어 있다는 것을 알 수 있습니다. 염두할 점은 C++의 경우라면 그 결과가 10 10 10 20 20 30 이라는 점입니다.  이제 이렇게 저장된 요소 중에 키가 10인 요소에 대한 값을 얻는 코드를 살펴보면 아래와 같습니다.

List list = msd_[10];
Console.Write("key 10 [ ");
for(int i=0; i

실행 결과는 아래와 같습니다.

사용자 삽입 이미지

키가 10인 요소에 대한 값이 모두 3개인데, 생각했던 올바른 결과가 나온 것을 확인할 수 있습니다. C#에서 .NET을 살펴보면 볼수록 참으로 체계적이고 멋진 언어 그리고 프레임워크라고 생각됩니다.

[C#] 동적 Bitmap 생성

.NET에서 C# 코드로 비트맵을 생성하고 생성한 이 비트맵에 원하는 그래픽 요소를 그린 후 스트림에 전송하는 방법에 대한 정리입니다. 매우 간단한 내용이지만 그래픽에 대해 관심이 많은 개발자로써 천천히 정리해 봤습니다.

int w = 100;
int h = 100;

Image img = new Bitmap(w, h);
Graphics grp = Graphics.FromImage(img);

위의 코드는 100×100 크기의 비트맵 이미지를 생성하고 이 이미지에 그래픽 요소를 그리기 위한 Graphics 클래스의 인스턴스와 바인딩 합니다. 이제 Graphics 클래스의 인스턴스 변수인 grp를 이용해 우리가 원하는 그래픽 요소를 그릴 수 있습니다. 아래는 간단하게 선을 그리고 파일로 저장하는 코드입니다.

grp.DrawLine(Pens.Aqua, 10, 10, 90, 90);
img.Save("d:/a.bmp");

저장된 파일은 아래와 같습니다.

그림을 살펴보면.. 그래픽 객체로 직접 선을 그린 픽셀을 제외하고 나머지 픽셀들은 모두 투명이라는 것을 알 수 있습니다. 그리고 아래의 코드는 비트맵 이미지를 구성하는 픽셀 하나 하나에 대한 색상 정보를 가져올 수 있는 힌트를 제공하는 코드입니다.

Bitmap bmp = img as Bitmap;
Color clr = bmp.GetPixel(10, 10);
MessageBox.Show(clr.ToString());

MessageBox를 통해 Color타입의 clr을 toString 매서드를 통해 얻은 값은 아래 그림과 같습니다. 자바와 같이 C# 역시 모든 객체에 대해 toString() 매서드를 제공하여 자신에 대한 정보를 사용자가 읽어 파악할 수 있는 문자열 형태의 값을 제공하고 있습니다.

사용자 삽입 이미지
끝으로 픽셀값을 Color 타입으로 가져오고 있습니다. Color는 퍼포먼스를 위해서 클래스가 이난 구조체 타입으로 선언되어 있습니다.

[C#] DataTable 생성

NET의 DataTable은 개발자들에 데이터를 주고 받기 위한 인터페이스로써의 표준으로 생각해도 별 무리가 없을듯 합니다. 아직은 .NET 초년생이라 잘 모르겠습니다만… 어떤 형식을 가지고 있는 데이터를 개발자 사이에서 주고 받을때 데이터 덩어리만 툭… 던져주기 보다는 이 데이터 덩어리를 읽을 수 있는 인인터페이스까지 제공해 주면 더욱 좋을텐데요. 바로 이 인터페이스가 되는 녀석으로 DataTable을 사용하면 참 좋을것 같습니다.

DataTable은 이 클래스의 이름에서도 나와 있듯 데이터베이스에서 테이블에 해당하는 녀석입니다. 테이블은 필드들로 구성되어 있고.. 이 필드들에 대한 레코드들로 구성됩니다. 필드는 컬럼(Column)이라고도 하며 레코드는 로우(Row)라고도 합니다.

데이터에 대해서 개발자 서로간에 인정할 수 있는 방법으로써 DataTable을 사용해야 할 필요가 생겨 DataTable을 생성하는 방법에 대해 정리해 봅니다.

사용자 삽입 이미지
위의 도식도를 보면 DataTable은 DataColumn과 DataRow 클래스에 대한 다수의 인스턴스를 가지고 있다는 것을 알 수 있습니다. DataColumn은 필드의 정의이며 DataRow은 레코드에 대한 정의입니다. .NET을 개발한 MS 개발자들 덕에 참…. 쉽죠잉? -_-;

먼저 DataTable을 생성하는 코드는 아래와 같습니다.

DataTable dt = new DataTable("TableName");

생성자의 인자는 테이블의 이름입니다. 참고로 다수의 DataTable은 DataSet에 포함될 수 있는데 이 DataSet에서의 식별자가 바로 이 테이블의 이름입니다. 식별자이므로 당연히 중복되는 큰~ 일 나는 겁니다.

다음은 이렇게 생성한 테이블에 필드를 정의하는 코드입니다. 식별자로써 ID와 이름으로써 Name, 나이값으로써 Age 필드를 정의하는 코드입니다.

DataColumn col1 = new DataColumn();
col1.DataType = System.Type.GetType("System.Int32");
col1.ColumnName = "ID";
col1.AutoIncrement = true;
dt.Columns.Add(col1);

DataColumn col2 = new DataColumn();
col2.DataType = System.Type.GetType("System.String");
col2.ColumnName = "Name";
col2.DefaultValue = "No Name";
dt.Columns.Add(col2);

DataColumn col3 = new DataColumn();
col3.DataType = System.Type.GetType("System.Int32");
col3.ColumnName = "Age";
col3.DefaultValue = 0;
dt.Columns.Add(col3);

각 필드(컬럼)에 대한 데이터 타입은 .NET의 Type의 그것을 그대로…. 사용할 수 있도록 되어 있습니다. 그리고 아래는 이제 이렇게 정의된 필드에 대해 레코드를 추가하는 코드입니다.

DataRow dr1 = dt.NewRow();
dr1["Name"] = "개똥이";
dr1["Age"] = 10;
dt.Rows.Add(dr1);

DataRow dr2 = dt.NewRow();
dr2["Name"] = "소똥이";
dr2["Age"] = 13;
dt.Rows.Add(dr2);

DataRow dr3 = dt.NewRow();
dr3["Name"] = "말똥이";
dr3["Age"] = 15;
dt.Rows.Add(dr3);

레코드에 해당되는 DataRow는 DataTable의 NewRow 매서드를 통해 생성된다는 점에 주의해야 합니다.

끝으로 테이블을 정의할때 Primary Key 등과 같은 정의를 빼놓을 수 없습니다. 아래는 간단히 앞서 정의한 ID 필드값으로 Primary Key를 정의하는 코드입니다.

DataColumn[] key = new DataColumn[1];
key[0] = col1;
dt.PrimaryKey = key;

이상으로 기본적으로 DataTable을 생성하고 컬럼과 레코드를 추가하는 것에 대해 정리해 보았습니다.