Türkçe içerik için >>>

TAC-Pro: Turkish Academic Corpus Project
(Enter concordance)

The TAC-Pro Corpus has been developed at Karadeniz Technical University by a team of researchers supported by KTU Scientific Research Projects Unit with the code: HDP-11001. The title of the project is: “The Development of an Internet Accessible Corpus of Turkish Scholarly writing in English”.

The aim of the project
The aims of this project are (a) to design the methodology for compiling a representative corpus of social sciences academic research articles written by Turkish scholars, (b) to compile and make accessible a representative corpus of social sciences academic research articles written by Turkish scholars. (c) to compile a comparative native speaker corpus of social sciences academic research articles written by native speakers. (d) to make the corpus available for researchers who wish to conduct research on NNS academic writing in the social sciences.

Corpus Description
The corpus is a collection of social sciences research articles from leading social sciences journals published in Turkey. The corpus covers a period of three years between the years 2009-2011. The starting date was chosen to be 2009 since some of the journals included in the corpus became available on the internet only after this year. However the compilation process is an ongoing one and new articles are being added into the corpus gradually. The word count of the corpus is approximately 1.500.000 words. Wod count of the Native speaker corpus is approximately 2.000.000 words. The total size of the corpora are about 3.500.000 words.

History of the Project
The project was first launched at the Northern Arizona University, Corpus Lab in 2009 by the head researcher Elif Demirel with the contribution and guidance of Douglas Biber. The TAC-Pro corpus has been POS tagged by the Biber tagger and a future goal is to make the tagged corpus accessible on the internet as well.

Copyright
The copyright of the project (HDP-11001) belongs to the KTU-BAP Unit and the project director Assist. Prof. Dr. Elif Demirel.

Acknowledgements
The project was supported by a research grant from Karadeniz Technical University from September 2013 to September 2014. The researcher wants to express her deepest gratitude to Douglas Biber and Randi Reppen of Northern Arizona University for their guidance and endless support on the project during her studies at the Northern Arizona University-Corpus Lab. Special thanks go to the research team members Tuncer Yılmaz, Duygu Yılmaz, Sevcan Çepni Bayraktar and Avni Babaoğlu for their hard work and support.

Selected References

Ädel, A. (2010).
Just to give you kind of a map of where we are going: A taxonomy of metadiscourse in spoken and written academic english. Nordic Journal Of English Studies, 9(2), 69-97.

Al, U.; Şahiner, M. & Tonta, Y. (2006).
Arts and humanities literature: Bibliometric characteristics of contributions by turkish authors. Journal of the American Society for Information Science and Technology, 57(8):1011–1022

Antony, L. (2011). AntConc (Version3.2.0).
[Computer Software]. Tokyo, Japan: Waseda University. Available from “http://www.antlab.sci.waseda.ac.jp/

Başaran, S.; Sofu, H. (2009)
The process of writing research articles in English and getting published: A case study, Gaziantep Üniversitesi Sosyal Bilimler Dergisi, 8(2):371 -384

Biber, D. (1985).
Investigating macroscopic textual variation through multi-feature/ multidimensional analyses. Linguistics, 23: 337– 360.

Biber, D. (1986).
Spoken and written textual dimensions in English: Resolving the contradictory findings. Language, 62, 384– 414.

Biber, D. (1988).
Variation across speech and writing. Cambridge: Cambridge University Press.

Biber, D. (1995).
Dimensions of register variation: A cross-linguistic comparison. Cambridge: Cambridge University Press.

Biber, D., Conrad ,S. & Reppen, R. (1998).
Corpus linguistics: Investigating language structure and use. Cambridge: Cambridge University Press.

Biber, D., Johansson, S., Leech, G., Conrad, S., Finegan, E. (1999).
Longman grammar of spoken and written english. Essex: Pearson Education Limited

Bowker, L. (2001).
Terminology and gender sensitivity: A corpus-based study of the lsp of infertility. Language In Society, (4), 589

Biber, D., Susan, C., & Viviana, C. (2004).
If you look at …: Lexical bundles in university teaching and textbooks. Applied Linguistics, 25(3), 371-405.

Biber, D., Davies, M., Jones, J. K. & Tracy-Ventura, N. (2006)
Spoken and Written register variation in Spanish: A multi-dimensional analysis. Corpora 1 (1) 7-38.

Collins, P. (2008).
The progressive aspect in world englishes: A corpus-based study. Australian Journal Of Linguistics, 28(2), 225-249.

Cortes, V. (2004).
Lexical bundles in published and student disciplinary writing: Examples from history and biology. English for Specific Purposes, 23(4), 397-423.

Csomay, E. (2005).
Linguistic variation within university classroom talk:A corpus-based perspective, Linguistics and Education, 15 : 243–274

Çelik, M. (2009).
Linguistics for Students of English(Vol. II). Lecture Notes.

Karabacak, E. and Qin, J.( 2012).
Comparison of lexical bundles used by Turkish, Chinese and American university students. Procedia-Social and Behavioral Sciences 70, 622-628.

Kennedy, G. (1998).
An introduction to corpus linguistics. New York:Addison Wesley Longman Inc.

Kachru, Y. (2008)
Language variation and corpus linguistics, World Englishes, 27(1): 1–8 Kusseling, F. (2012).
A corpus-based evaluation of the common European framework vocabulary for French teaching and learning. Brigham Young University. ProQuest Dissertations and Theses, 183.

Lindquist, H. (2009)
. Corpus linguistics and the description of English. Edinburgh: Edinburgh University Press.

Mak, K.T. (2005).
The dynamics of collocation: A corpus-based study of the phraseology and pragmatics of the introductory-it construction. Austin: University of Texas. Doctoral Dissertation.

Pakir, A. (2009).
English as a lingua franca: analyzing research frameworks in international English, world Englishes, and ELF. World Englishes, 28(2), 224-235.

Pastor, M.L.C. (2009).
Contrasting specific English corpora: Language variation. International Journal of English Studies, Special Issue, 221-33

Rafiee, M., Tavakoli, M., & Amirian, Z. (2011).
structural analysis of lexical bundles across two types of English news papers edited by native and non-native speakers. Modern Journal Of Applied Linguistics, 3(2/3), 136-155.

Ranjbar, N., Pazhakh, A., & Goijian, B. (2012).
The effect of lexical bundles on Iranian EFL learners linguistic production fluency. International Education Studies, 5(4), 243-251.

Reppen, R., Fitzmaurice S. M. & Biber, D. (2002).
Using Corpora to Explore Linguistic Variation. Amsterdam: J. Benjamins.

Ruhi, Ş. (Project Director) (2010)
METU Spoken Turkish Corpus Project , Project number: TÜBİTAK 108K283

Contact
Project Director Assist. Prof. Dr. Elif Demirel
Karadeniz Technical University
Department of English Language and Literature
61080
Trabzon/TURKEY
e-mail: elif@ktu.edu.tr
office: 0 462 377 3543

Proje Kodu :
HDP-11001

Proje Adı:
The Development of an Internet Accessible Corpus of Turkish Scholarly Writing in English: The TAC(Turkish Academic Corpus) Project

  İngilizce'nin globalleşen bilim dünyasındaki üstünlüğü her milliyetten araştırmacıları bilimsel yayınlarını İngilizce yazmaya teşvik etmektedir. Bu araştırmacılar için İngilizce ek bir dil görevi üstlenmektedir çünkü araştırmalarını hem kendi ana dillerinde hem de akademik dünyada geçerliliği olan İngiliz dilinde bilimsel çalışmalar yazmaktadırlar. Türkiye'de üniversiteler akademik dergilerinde yayın dili olarak İngilizce'ye artarak yer vermeye başlamışlardır ve birçok üniversitenin ve bilim kuruluşlarının akademik dergilerinde hem İngilizce hem de Türkçe yayınlar kabul edilmektedir. Fakat, uluslararası indekslere dahil olan dergilerde yayın yapmak hem Türk araştırmacılar, hem de diğer milletlerden araştırmacılar tarafından daha saygın kabul edilmektedir (Li - Flowerdew, 2009).

  Global akademik dünyada Sosyal Bilimler Indeksinde (A-HCI) Türk araştırmacıların İngilizce yazdıkları yayın sayısı artmaya başlamıştır. Örneğin, 1999-2003 yılları arasındaki yayınları inceleyen bir araştırma 507 sosyal bilimler dergisinde Türk Kurumları ile ilişkili olan yazarların yayınlarının %91'inin İngilizce yazıldığını göstermiştir (Al, Şahiner and Tonta, 2006). Türk araştırmacıların İngilizce yayınları ana dili İngilizce olan yazarların yayınları ile aynı dergilerde yer bulmaktadır. Fakat yayınların kabul edilme süreçleri uzun sürmekte ve birçok yayın akademik anlamda güçlü olmalarına rağmen dil kullanımındaki standartları tutturamadıkları için geri çevrilebilmektedir. Bu anlamda ana dili İngilizce olan yazarlar ile ana dili İngilizce olmayan yazarların İngilizce kullanarak yazdıkları akademik makalelerinin dilbilimsel olarak karşılaştırılması araştırmacılara ışık tutmak açısından önem kazanmaktadır. Dünyada bu tür araştırmalar hız kazanmış ve İngilizce'nin ikinci dil olarak kullanıldığı birçok ülkede o ülkeye özgü İngilizce'nin özelliklerini belirlemek amacıyla derlem çalışmaları yapılagelmektedir (Biber, 1988; Schmied, 2012; Rooy, Terblanche, Haase ve Schmied, 2010). Fakat ülkemizde Türk akademik yazınını ayrıntılı ve sistematik bir biçimde inceleyen çok sınırlı sayıda çalışmalar vardır ve Türk araştırmacılar tarafından yazılmış İngilizce metinleri içeren bir derlem çalışması bulunmamaktadır. Bu tür sistematik ve güncel bir derlemin toplanması Türkiye'de derlem dilbilimi çalışmalarına ışık tutacak ve Türk akademik yazınının gelişmesine de katkıda bulunacaktır.

  Bu çalışmanın öncelikli amacı Türk araştırmacıların İngilizce kullanarak yazdıkları ve Türk üniversiteleri ve bilim kuruluşlarının akademik dergileri tarafından yayınlanmış olan akademik yayınların güncel ve sistematik bir derlemini toplamaktır. Daha sonra bu derlem üzerinde dilbilimsel araştırmalar yapılarak ana dili İngilizce olan yazarların makaleleri ile aralarında bulunan benzerlik ve farklılıklar ortaya konulmaya çalışılacaktır. Son olarak oluşturulan derlemin yurt içinde ve yurtdışında diğer derlem dilbilimi araştırmacılarının kullanımına sunulması için halihazırda var olan British National Corpus (BNC Consortium, 2001) ve COCA (Corpus of Contemporary American English) (Brigham Young University, 1990) derlemlerine benzer bir internet platformu geliştirilecektir.

Homepage     About Us     Contact Us

Web Design: Avni Babaoğlu LinkedIn
Project Director: Elif TOKDEMİR DEMİREL Web Page
© 2014 , All rights reserved.