CIKM 2008论文列表 - Proceedings of the 17th ACM Conference on Information and Knowledge Management, CIKM 2008, Napa Valley, California, USA, October 26-30, 2008.| 数据学习 (DataLearner)

cikm 2008 论文列表

Proceedings of the 17th ACM Conference on Information and Knowledge Management, CIKM 2008, Napa Valley, California, USA, October 26-30, 2008.

Categorizing blogger's interests based on short snippets of blog posts.

Jiahui Liu Larry Birnbaum Bryan Pardo

A matrix-based approach for semi-supervised document co-clustering.

Yanhua Chen Lijun Wang Ming Dong

A coarse-grain grid-based subspace clustering method for online multi-dimensional data streams.

Jae Woo Lee Won Suk Lee

Clustering multi-way data via adaptive subspace iteration.

Wei Peng Tao Li Bo Shao

Semi-supervised text categorization by active search.

Zenglin Xu Rong Jin Kaizhu Huang Michael R. Lyu Irwin King

Multi-scale characterization of social network dynamics in the blogosphere.

Munmun De Choudhury Hari Sundaram Ajita John Dorée D. Seligmann

Exploiting context to detect sensitive information in call center conversations.

Tanveer A. Faruquie Sumit Negi Anup Chalamalla L. Venkata Subramaniam

Incorporating topical support documents into a small training set in text categorization.

Kyung Soon Lee

Effective pattern taxonomy mining in text documents.

Yuefeng Li Sheng-Tang Wu Xiaohui Tao

Boosting social annotations using propagation.

Shenghua Bao Bohai Yang Ben Fei Shengliang Xu Zhong Su Yong Yu

A spam resistant family of concavo-convex ranks for link analysis.

Sreangsu Acharyya Joydeep Ghosh

Trust, authority and popularity in social information retrieval.

Gabriella Kazai Natasa Milic-Frayling

SHOPSMART: product recommendations through technical specifications and user reviews.

Alexander Yates James Joseph Ana-Maria Popescu Alexander D. Cohn Nick Sillick

Utilization of navigational queries for result presentation and caching in search engines.

Rifat Ozcan Ismail Sengör Altingövde Özgür Ulusoy

Measuring user preference changes in digital libraries.

Yang Sun Huajing Li Isaac G. Councill Wang-Chien Lee C. Lee Giles

Using a graph-based ontological user profile for personalizing search.

Mariam Daoud Lynda Tamine-Lechani Mohand Boughanem

Using the current browsing context to improve search relevance.

Mandar Rahurkar Silviu Cucerzan

The effect of contextualization at different granularity levels in content-oriented xml retrieval.

Paavo Arvola Jaana Kekäläinen Marko Junkkari

Incorporating place name extents into geo-ir ranking.

Hiroyuki Toda Norihito Yasuda Yumiko Matsuura Ryoji Kataoka

A georeferencing multistage method for locating geographic context in web search.

Álvaro Zubizarreta Pablo de la Fuente José Manuel Cantera Mario Arias Jorge Cabrero Alonso Guido García Bernardo César Llamas Jesús Vegas

Efficient estimation of the size of text deep web data source.

Jianguo Lu

Re-considering neighborhood-based collaborative filtering parameters in the context of new data.

Adele E. Howe Ryan D. Forbes

Suppressing outliers in pairwise preference ranking.

Vitor R. Carvalho Jonathan L. Elsas William W. Cohen Jaime G. Carbonell

Workload-based optimization of integration processes.

Matthias Böhm Uwe Wloka Dirk Habich Wolfgang Lehner

Polyhedral transformation for indexed rank order correlation queries.

Philon Nguyen Nematollaah Shiri

Protecting location privacy against location-dependent attack in mobile services.

Xiao Pan Jianliang Xu Xiaofeng Meng

Table summarization with the help of domain lattices.

K. Selçuk Candan Huiping Cao Yan Qi Maria Luisa Sapino

Energy-efficient skyline query processing and maintenance in sensor networks.

Weifa Liang Baichen Chen Jeffrey Xu Yu

Combining concept hierarchies and statistical topic models.

Chaitanya Chemudugunta Padhraic Smyth Mark Steyvers

Scalable complex pattern search in sequential data.

Leila Kaghazian Dennis McLeod Reza Sadri

In the development of a spanish metamap.

Francisco M. Carrero José Carlos Cortizo José María Gómez Manuel de Buenaga Rodríguez

Decomposition of terminology graphs for domain knowledge acquisition.

Fidelia Ibekwe-Sanjuan Eric SanJuan Michael S. E. Vogeley

Fast spatial co-location mining without cliqueness checking.

Zhongshan Lin SeungJin Lim

On quantifying changes in temporally evolving dataset.

Rohan Choudhary Sameep Mehta Amitabha Bagchi

Semi-supervised metric learning by maximizing constraint margin.

Fei Wang Shouchun Chen Changshui Zhang Tao Li

Detecting significant distinguishing sets among bi-clusters.

Faris Alqadah Raj Bhatnagar

Pattern-based semantic class discovery with multi-membership support.

Shuming Shi Xiaokang Liu Ji-Rong Wen

Deriving non-redundant approximate association rules from hierarchical datasets.

Gavin Shaw Yue Xu Shlomo Geva

GHOST: an effective graph-based framework for name distinction.

Xiaoming Fan Jianyong Wang Bing Lv Lizhu Zhou Wei Hu

Efficient frequent pattern mining over data streams.

Syed Khairuzzaman Tanbeer Chowdhury Farhan Ahmed Byeong-Soo Jeong Young-Koo Lee

Collaborative partitioning with maximum user satisfaction.

Fred S. Annexstein Svetlana Strunjas

Group-based learning: a boosting approach.

Weijian Ni Jun Xu Hang Li Yalou Huang

Entity-based query reformulation using wikipedia.

Yang Xu Fan Ding Bin Wang

Search-based query suggestion.

Jiang-Ming Yang Rui Cai Feng Jing Shuo Wang Lei Zhang Wei-Ying Ma

Answering general time sensitive queries.

Wisam Dakka Luis Gravano Panagiotis G. Ipeirotis

Integrating clustering and multi-document summarization to improve document understanding.

Dingding Wang Shenghuo Zhu Tao Li Yun Chi Yihong Gong

A novel statistical chinese language model and its application in pinyin-to-character conversion.

Bo Lin Jun Zhang

Evaluating topic models for information retrieval.

Xing Yi James Allan

Ranking in folksonomy systems: can context help?

Fabian Abel Nicola Henze Daniel Krause

Semi-supervised ranking aggregation.

Shouchun Chen Fei Wang Yangqiu Song Changshui Zhang

Estimating retrieval effectiveness using rank distributions.

Vishwa Vinay Natasa Milic-Frayling Ingemar J. Cox

Mining named entity transliteration equivalents from comparable corpora.

Raghavendra Udupa K. Saravanan A. Kumaran Jagadeesh Jagarlamudi

Modeling document features for expert finding.

Jianhan Zhu Dawei Song Stefan M. Rüger Xiangji Huang

A survey of pre-retrieval query performance predictors.

Claudia Hauff Djoerd Hiemstra Franciska de Jong

A latent variable model for query expansion using the hidden markov model.

Qiang Huang Dawei Song

Improve the effectiveness of the opinion retrieval and opinion polarity classification.

Wei Zhang Lifeng Jia Clement T. Yu Weiyi Meng

Natural language retrieval of grocery products.

Petteri Nurmi Eemil Lagerspetz Wray L. Buntine Patrik Floréen Joonas Kukkonen Peter Peltonen

Characterization of TPC-H queries for a column-oriented database on a dual-core amd athlon processor.

Pranav Vaidya Jaehwan John Lee

Evaluating partial tree-pattern queries on XML streams.

Xiaoying Wu Dimitri Theodoratos

Estimating the number of answers with guarantees for structured queries in p2p databases.

Marcel Karnstedt Kai-Uwe Sattler Michael Haß Manfred Hauswirth Brahmananda Sapkota Roman Schmidt

Query optimization in xml-based information integration.

Dongfeng Chen Rada Chirkova Maxim Kormilitsin Fereidoon Sadri Timo J. Salo

A light weighted damage tracking quarantine and recovery scheme for mission-critical database systems.

Kun Bai Peng Liu

Data degradation: making private data less sensitive over time.

Nicolas Anciaux Luc Bouganim Harold van Heerde Philippe Pucheral Peter M. G. Apers

Efficient processing of probabilistic spatio-temporal range queries over moving objects.

Bruce S. E. Chung Wang-Chien Lee Arbee L. P. Chen

Closing the loop in webpage understanding.

Chunyu Yang Yong Cao Zaiqing Nie Jie Zhou Ji-Rong Wen

Tag-based filtering for personalized bookmark recommendations.

Pavan Kumar Vatturi Werner Geyer Casey Dugan Michael J. Muller Beth Brownholtz

A novel email abstraction scheme for spam detection.

Chi-Yao Tseng Pin-Chieh Sung Ming-Syan Chen

Coreex: content extraction from online news articles.

Jyotika Prasad Andreas Paepcke

Efficient web matrix processing based on dual reordering.

Chih-Ming Hsu Ming-Syan Chen

Representative entry selection for profiling blogs.

Jinfeng Zhuang Steven C. H. Hoi Aixin Sun Rong Jin

Estimating real-valued characteristics of criminals from their recorded crimes.

Richard Bache Fabio Crestani

Handling implicit geographic evidence for geographic ir.

Nuno Cardoso Mário J. Silva Diana Santos

Using tag semantic network for keyphrase extraction in blogs.

Lizhen Qu Christof Müller Iryna Gurevych

Summarization of social activity over time: people, actions and concepts in dynamic networks.

Yu-Ru Lin Hari Sundaram Aisling Kelliher

Large maximal cliques enumeration in sparse graphs.

Natwar Modani Kuntal Dey

A method to predict social annotations.

Ming-Hung Hsu Hsin-Hsi Chen

Coreference resolution using expressive logic models.

Ki Chan Wai Lam Xiaofeng Yu

Overlapping community structure detection in networks.

Nan Du Bai Wang Bin Wu

An integration strategy for mining product features and opinions.

Qingliang Miao Qiudan Li Ruwei Dai

Metadata extraction and indexing for map search in web documents.

Qingzhao Tan Prasenjit Mitra C. Lee Giles

Corpus microsurgery: criteria optimization for medical cross-language ir.

Monica Rogati Yiming Yang Jaime G. Carbonell

Investigating external corpus and clickthrough statistics for query expansion in the legal domain.

Tonya Custis Khalid Al-Kofahi

Siphon++: a hidden-webcrawler for keyword-based interfaces.

Karane Vieira Luciano Barbosa Juliana Freire Altigran Soares da Silva

Cross-document cross-lingual coreference retrieval.

Elif Aktolga Marc-Allen Cartright James Allan

Passage relevance models for genomics search.

Jay Urbain Ophir Frieder Nazli Goharian

Using sequence classification for filtering web pages.

Binyamin Rosenfeld Ronen Feldman Lyle H. Ungar

Winnowing-based text clustering.

Javier Parapar Alvaro Barreiro

Searching the wikipedia with contextual information.

Antti Ukkonen Carlos Castillo Debora Donato Aristides Gionis

Nested region algebra extended with variables for tag-annotated text search.

Katsuya Masuda Jun'ichi Tsujii

Online spam-blog detection through blog search.

Linhong Zhu Aixin Sun Byron Choi

An extension of PLSA for document clustering.

Young-Min Kim Jean-François Pessiot Massih-Reza Amini Patrick Gallinari

A note on search based forecasting of ad volume in contextual advertising.

Xuerui Wang Andrei Z. Broder Marcus Fontoura Vanja Josifovski

Speed up semantic search in p2p networks.

Qiang Wang Rui Li Lei Chen Jie Lian M. Tamer Özsu

An approximate string matching approach for handling incorrectly typed urls.

Mihai Stroe Radu Berinde Cosmin Negruseri Dan Popovici

Yizkor books: a voice for the silent past.

Jason J. Soo Rebecca Cathey Ophir Frieder Michlean J. Amir Gideon Frieder

Transaction reordering with application to synchronized scans.

Gang Luo Jeffrey F. Naughton Curt J. Ellmann Michael Watzke

PBFilter: indexing flash-resident data through partitioned summaries.

Shaoyi Yin Philippe Pucheral Xiaofeng Meng

SQL extension for exploring multiple tables.

Sung Jin Kim Junghoo John Cho

View and index selection for query-performance improvement: quality-centered algorithms and heuristics.

Maxim Kormilitsin Rada Chirkova Yahya Fathi Matthias F. Stallmann

ROAD: an efficient framework for location dependentspatial queries on road networks.

Ken C. K. Lee Wang-Chien Lee Baihua Zheng

Scaling up duplicate detection in graph data.

Melanie Herschel Felix Naumann

CE2: towards a large scale hybrid search engine with integrated ranking support.

Haofen Wang Thanh Tran Chang Liu

Privacy-preserving data publishing for horizontally partitioned databases.

Pawel Jurczyk Li Xiong

Identifying table boundaries in digital documents via sparse line detection.

Ying Liu Prasenjit Mitra C. Lee Giles

Academic conference homepage understanding using constrained hierarchical conditional random fields.

Xin Xin Juanzi Li Jie Tang Qiong Luo

Intra-document structural frequency features for semi-supervised domain adaptation.

Andrew Arnold William W. Cohen

A system for finding biological entities that satisfy certain conditions from texts.

Wei Zhou Clement T. Yu Weiyi Meng

Cache-aware load balancing for question answering.

David Dominguez-Sal Mihai Surdeanu Josep Aguilar-Saborit Josep Lluís Larriba-Pey

Answering questions with authority.

Andrew Hickl

PROQID: partial restarts of queries in distributed databases.

Jon Olav Hauglid Kjetil Nørvåg

Adaptive distributed indexing for structured peer-to-peer networks.

Linh Thai Nguyen Wai Gen Yee Ophir Frieder

Valid scope computation for location-dependent spatial query in mobile broadcast environments.

Ken C. K. Lee Josh Schiffman Baihua Zheng Wang-Chien Lee

Extremely fast text feature extraction for classification and indexing.

George Forman Evan Kirshenbaum

Information shared by many objects.

Chong Long Xiaoyan Zhu Ming Li Bin Ma

Scalable community discovery on textual data with relations.

Huajing Li Zaiqing Nie Wang-Chien Lee C. Lee Giles Ji-Rong Wen

Identification of class specific discourse patterns.

Anup Chalamalla Sumit Negi L. Venkata Subramaniam Ganesh Ramakrishnan

Using structured text for large-scale attribute extraction.

Sujith Ravi Marius Pasca

A densitometric approach to web page segmentation.

Christian Kohlschütter Wolfgang Nejdl

A generative retrieval model for structured documents.

Le Zhao Jamie Callan

Structural relevance: a common basis for the evaluation of structured document retrieval.

Mir Sadek Ali Mariano P. Consens Gabriella Kazai Mounia Lalmas

Trada: tree based ranking function adaptation.

Keke Chen Rongqing Lu C. K. Wong Gordon Sun Larry P. Heck Belle L. Tseng

Modeling multi-step relevance propagation for expert finding.

Pavel Serdyukov Henning Rode Djoerd Hiemstra

Dr. Searcher and Mr. Browser: a unified hyperlink-click graph.

Barbara Poblete Carlos Castillo Aristides Gionis

Multi-aspect expertise matching for review assignment.

Maryam Karimzadehgan ChengXiang Zhai Geneva G. Belford

An effective algorithm for mining 3-clusters in vertically partitioned data.

Faris Alqadah Raj Bhatnagar

EDSC: efficient density-based subspace clustering.

Ira Assent Ralph Krieger Emmanuel Müller Thomas Seidl

Data weaving: scaling up the state-of-the-art in data clustering.

Ron Bekkerman Martin Scholz

A consensus based approach to constrained clustering of software requirements.

Chuan Duan Jane Cleland-Huang Bamshad Mobasher

An effective statistical approach to blog post opinion retrieval.

Ben He Craig Macdonald Jiyin He Iadh Ounis

Blog site search using resource selection.

Jangwon Seo W. Bruce Croft

Key blog distillation: ranking aggregates.

Craig Macdonald Iadh Ounis

Automatic online news topic ranking using media focus and user attention based on aging theory.

Canhui Wang Min Zhang Liyun Ru Shaoping Ma

A two-stage text mining model for information filtering.

Yuefeng Li Xujuan Zhou Peter Bruza Yue Xu Raymond Y. K. Lau

Search advertising using web relevance feedback.

Andrei Z. Broder Peter Ciccolo Marcus Fontoura Evgeniy Gabrilovich Vanja Josifovski Lance Riedel

To swing or not to swing: learning when (not) to advertise.

Andrei Z. Broder Massimiliano Ciaramita Marcus Fontoura Evgeniy Gabrilovich Vanja Josifovski Donald Metzler Vanessa Murdock Vassilis Plachouras

Unsolved problems in search: (and how we approach them).

W. Bruce Croft

The social (open) workspace.

David A. Evans Susan Feldman Ed H. Chi Natasa Milic-Frayling Igor Perisic

Structure feature selection for graph classification.

Hongliang Fei Jun Huan

Real-time data pre-processing technique for efficient feature extraction in large scale datasets.

Ying Liu Lucian Vlad Lita Radu Stefan Niculescu Kun Bai Prasenjit Mitra C. Lee Giles

Mining influential attributes that capture class and group contrast behaviour.

Elsa Loekito James Bailey

REDUS: finding reducible subspaces in high dimensional data.

Xiang Zhang Feng Pan Wei Wang

A random walk on the red carpet: rating movies with user reviews and pagerank.

Derry Tanti Wijaya Stéphane Bressan

Probabilistic polyadic factorization and its application to personalized recommendation.

Yun Chi Shenghuo Zhu Yihong Gong Yi Zhang

SoRec: social recommendation using probabilistic matrix factorization.

Hao Ma Haixuan Yang Michael R. Lyu Irwin King

Tapping on the potential of q&a community by recommending answer providers.

Jinwen Guo Shengliang Xu Shenghua Bao Yong Yu

Modeling hidden topics on document manifold.

Deng Cai Qiaozhu Mei Jiawei Han Chengxiang Zhai

AdaSum: an adaptive model for summarization.

Jin Zhang Xueqi Cheng Gaowei Wu Hongbo Xu

Ranked feature fusion models for ad hoc retrieval.

Jeremy Pickens Gene Golovchinsky

Joke retrieval: recognizing the same joke told differently.

Lisa Friedland James Allan

Records retention in relational database systems.

Ahmed A. Ataullah Ashraf Aboulnaga Frank Wm. Tompa

Dual encryption for query integrity assurance.

Haixun Wang Jian Yin Chang-Shing Perng Philip S. Yu

Vanity fair: privacy in querylog bundles.

Rosie Jones Ravi Kumar Bo Pang Andrew Tomkins

Efficient techniques for document sanitization.

Venkatesan T. Chakaravarthy Himanshu Gupta Prasan Roy Mukesh K. Mohania

Peer production of structured knowledge -: an empirical study of ratings and incentive mechanisms.

Christian Hütter Conny Kühne Klemens Böhm

Association thesaurus construction methods based on link co-occurrence analysis for wikipedia.

Masahiro Ito Kotaro Nakayama Takahiro Hara Shojiro Nishio

Finding informative commonalities in concept collections.

Simona Colucci Eugenio Di Sciascio Francesco M. Donini Eufemia Tinelli

Wildcards for lightweight information integration in virtual desktops.

Rodolfo Stecher Claudia Niederée Wolfgang Nejdl

Fast correlation analysis on time series datasets.

Philon Nguyen Nematollaah Shiri

Identification of gene function using prediction by partial matching (PPM) language models.

Malika Mahoui William John Teahan Arvind Kumar Thirumalaiswamy Sekhar Satyasaibabu Chilukuri

Predicting individual disease risk based on medical history.

Darcy A. Davis Nitesh V. Chawla Nicholas Blumm Nicholas A. Christakis Albert-László Barabási

Fast mining of complex time-stamped events.

Hanghang Tong Yasushi Sakurai Tina Eliassi-Rad Christos Faloutsos

On low dimensional random projections and similarity search.

Yu-En Lu Pietro Liò Steven Hand

High-dimensional descriptor indexing for large multimedia databases.

Eduardo Valle Matthieu Cord Sylvie Philipp-Foliguet

Translation enhancement: a new relevance feedback method for cross-language information retrieval.

Daqing He Dan Wu

Simultaneous multilingual search for translingual information retrieval.

Kristen Parton Kathleen R. McKeown James Allan Enrique Henestroza

Learning latent semantic relations from clickthrough data for query suggestion.

Hao Ma Haixuan Yang Irwin King Michael R. Lyu

Beyond the session timeout: automatic hierarchical segmentation of search topics in query logs.

Rosie Jones Kristina Lisa Klinkner

Matching task profiles and user needs in personalized web search.

Julia Luxenburger Shady Elbassuoni Gerhard Weikum

Can phrase indexing help to process non-phrase queries?

Mingjie Zhu Shuming Shi Nenghai Yu Ji-Rong Wen

Modeling LSH for performance tuning.

Wei Dong Zhe Wang William Josephson Moses Charikar Kai Li

Supporting sub-document updates and queries in an inverted index.

Vuk Ercegovac Vanja Josifovski Ning Li Maurício R. Mediano Eugene J. Shekita

A new method for indexing genomes using on-disk suffix trees.

Marina Barsky Ulrike Stege Alex Thomo Chris Upton

Exploiting pipeline interruptions for efficient memory allocation.

Josep Aguilar-Saborit Mohammad Jalali Dave Sharpe Victor Muntés-Mulero

E-discovery.

David A. Evans Jason R. Baron Chris Buckley Robert S. Bauer

Proactive learning: cost-sensitive active learning with multiple imperfect oracles.

Pinar Donmez Jaime G. Carbonell

A framework for estimating complex probability density structures in data streams.

Arnold P. Boedihardjo Chang-Tien Lu Feng Chen

The query-flow graph: model and applications.

Paolo Boldi Francesco Bonchi Carlos Castillo Debora Donato Aristides Gionis Sebastiano Vigna

Clustered subset selection and its applications on it service metrics.

Christos Boutsidis Jimeng Sun Nikos Anerousis

How evaluator domain expertise affects search result relevance judgments.

Kenneth A. Kinney Scott B. Huffman Juting Zhai

Comparing metrics across TREC and NTCIR: the robustness to system bias.

Tetsuya Sakai

Statistical power in retrieval experimentation.

William Webber Alistair Moffat Justin Zobel

Retrievability: an evaluation measure for higher order information access tasks.

Leif Azzopardi Vishwa Vinay

A heuristic approach for checking containment of generalized tree-pattern queries.

Pawel Placek Dimitri Theodoratos Stefanos Souldatos Theodore Dalamagas Timos K. Sellis

Pruning nested XQuery queries.

Bilel Gueni Talel Abdessalem Bogdan Cautis Emmanuel Waller

Some rewrite optimizations of DB2 XQuery navigation.

Guangjun Xie Qi Cheng Jarek Gryz Calisto Zuzarte

Rewriting of visibly pushdown languages for xml data integration.

Alex Thomo Srinivasan Venkatesh

Markov logic: a unifying language for knowledge and information management.

Pedro M. Domingos

Learning to link with wikipedia.

David N. Milne Ian H. Witten

Discovering leaders from community actions.

Amit Goyal Francesco Bonchi Laks V. S. Lakshmanan

Non-local evidence for expert finding.

Krisztian Balog Maarten de Rijke

Mining term association patterns from search logs for effective query reformulation.

Xuanhui Wang ChengXiang Zhai

Query suggestion using hitting time.

Qiaozhu Mei Dengyong Zhou Kenneth Ward Church

Active relevance feedback for difficult queries.

Zuobing Xu Ram Akella

Understanding the relationship between searchers' queries and information goals.

Doug Downey Susan T. Dumais Daniel J. Liebling Eric Horvitz

Improved query difficulty prediction for the web.

Claudia Hauff Vanessa Murdock Ricardo Baeza-Yates

Relating dependent indexes using dempster-shafer theory.

Lixin Shi Jian-Yun Nie Guihong Cao

Revisiting the relationship between document length and relevance.

David E. Losada Leif Azzopardi Mark Baillie

TinyLex: static n-gram index pruning with perfect recall.

Derrick Coetzee

Generalized inverse document frequency.

Donald Metzler

Linear time membership in a class of regular expressions with interleaving and counting.

Giorgio Ghelli Dario Colazzo Carlo Sartiani

Real-time new event detection for video streams.

Gang Luo Rong Yan Philip S. Yu

SNIF TOOL: sniffing for patterns in continuous streams.

Abhishek Mukherji Elke A. Rundensteiner David C. Brown Venkatesh Raghavan

Anomaly-free incremental output in stream processing.

George A. Mihaila Ioana Stanoi Christian A. Lang

Inferring semantic query relations from collective user behavior.

Nish Parikh Neel Sundaresan

Predicting web spam with HTTP session information.

Steve Webb James Caverlee Calton Pu

Spam characterization and detection in peer-to-peer file-sharing systems.

Dongmei Jia Wai Gen Yee Ophir Frieder

An algorithm to determine peer-reviewers.

Marko A. Rodriguez Johan Bollen

Characterizing and predicting community members from evolutionary and heterogeneous networks.

Qiankun Zhao Sourav S. Bhowmick Xin Zheng Kai Yi

On effective presentation of graph patterns: a structural representative approach.

Chen Chen Cindy Xide Lin Xifeng Yan Jiawei Han

Link privacy in social networks.

Aleksandra Korolova Rajeev Motwani Shubha U. Nabar Ying Xu

Local approximation of pagerank and reverse pagerank.

Ziv Bar-Yossef Li-Tal Mashiach

Learning a two-stage SVM/CRF sequence classifier.

Guilherme Hoefel Charles Elkan

BNS feature scaling: an improved representation over tf-idf for svm text classification.

George Forman

Kernel methods, syntax and semantics for relational text categorization.

Alessandro Moschitti

Exploiting temporal contexts in text classification.

Leonardo Rocha Fernando Mourão Adriano C. M. Pereira Marcos André Gonçalves Wagner Meira Jr.

Mining social networks using heat diffusion processes for marketing candidates selection.

Hao Ma Haixuan Yang Michael R. Lyu Irwin King

Social tags: meaning and suggestions.

Fabian M. Suchanek Milan Vojnovic Dinan Gunawardena

Comparing citation contexts for information retrieval.

Anna Ritchie Stephen Robertson Simone Teufel

Can all tags be used for search?

Kerstin Bischoff Claudiu S. Firan Wolfgang Nejdl Raluca Paiu

A novel optimization approach to efficiently process aggregate similarity queries in metric access methods.

Humberto Luiz Razente Maria Camila Nardini Barioni Agma J. M. Traina Christos Faloutsos Caetano Traina Jr.

Modeling and exploiting query interactions in database systems.

Mumtaz Ahmad Ashraf Aboulnaga Shivnath Babu Kamesh Munagala

A step towards incremental maintenance of the composed schema mapping.

Gang Qian Yisheng Dong

Content-based filtering for efficient online materialized view maintenance.

Gang Luo Philip S. Yu

An empirical study of required dimensionality for large-scale latent semantic indexing applications.

Roger B. Bradford

MedSearch: a specialized search engine for medical information retrieval.

Gang Luo Chunqiang Tang Hao Yang Xing Wei

Semi-automated logging of contact center telephone calls.

Roy J. Byrd Mary S. Neff Wilfried Teiken Youngja Park Keh-Shin F. Cheng Stephen C. Gates Karthik Visweswariah

Web-scale named entity recognition.

Casey Whitelaw Alexander Kehlenbeck Nemanja Petrovic Lyle H. Ungar

Classifying networked entities with modularity kernels.

Dell Zhang Robert Mao

Transfer learning from multiple source domains via consensus regularization.

Ping Luo Fuzhen Zhuang Hui Xiong Yuhong Xiong Qing He

A sparse gaussian processes classification framework for fast tag suggestions.

Yang Song Lu Zhang C. Lee Giles

Error-driven generalist+experts (edge): a multi-stage ensemble framework for text categorization.

Jian Huang Omid Madani C. Lee Giles

Are click-through data adequate for learning web search rankings?

Zhicheng Dou Ruihua Song Xiaojie Yuan Ji-Rong Wen

Achieving both high precision and high recall in near-duplicate detection.

Lian'en Huang Lei Wang Xiaoming Li

Efficient and effective link analysis with precomputed salsa maps.

Marc Najork Nick Craswell

How does clickthrough data reflect retrieval quality?

Filip Radlinski Madhu Kurup Thorsten Joachims

Integrating web query results: holistic schema matching.

Shui-Lung Chuang Kevin Chen-Chuan Chang

A language for manipulating clustered web documents results.

Gloria Bordogna Alessandro Campi Giuseppe Psaila Stefania Ronchi

Minimum-effort driven dynamic faceted search in structured databases.

Senjuti Basu Roy Haidong Wang Gautam Das Ullas Nambiar Mukesh K. Mohania

Dynamic faceted search for discovery-driven analysis.

Debabrata Dash Jun Rao Nimrod Megiddo Anastasia Ailamaki Guy M. Lohman

Humane data mining.

Rakesh Agrawal