SIGKDD(KDD) 2006论文列表 - Proceedings of the Twelfth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Philadelphia, PA, USA, August 20-23, 2006.| 数据学习 (DataLearner)

SIGKDD(KDD) 2006 论文列表

Proceedings of the Twelfth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Philadelphia, PA, USA, August 20-23, 2006.

Is there a grand challenge or X-prize for data mining?

Gregory Piatetsky-Shapiro Robert Grossman Chabane Djeraba Ronen Feldman Lise Getoor Mohammed Javeed Zaki

Beyond classification and ranking: constrained optimization of the ROI.

Lian Yan Patrick Baldasare

Camouflaged fraud detection in domains with complex relationships.

Sankar Virdhagriswaran Gordon Dakin

YALE: rapid prototyping for complex data mining tasks.

Ingo Mierswa Michael Wurst Ralf Klinkenberg Martin Scholz Timm Euler

Maximum profit mining and its application in software development.

Charles X. Ling Victor S. Sheng Tilmann F. W. Bruckhaus Nazim H. Madhavji

Discovering significant OPSM subspace clusters in massive gene expression data.

Byron J. Gao Obi L. Griffith Martin Ester Steven J. M. Jones

A component-based framework for knowledge discovery in bioinformatics.

Julien Etienne Bernd Wachmann Lei Zhang

Mining citizen science data to predict orevalence of wild bird species.

Rich Caruana Mohamed Farid Elhawary Art Munson Mirek Riedewald Daria Sorokina Daniel Fink Wesley M. Hochachka Steve Kelling

Identifying "best bet" web search results by mining past user behavior.

Eugene Agichtein Zijian Zheng

Opportunity map: identifying causes of failure - a deployed data mining system.

Kaidi Zhao Bing Liu Jeffrey Benkler Weimin Xiao

Understandable models Of music collections based on exhaustive feature generation with temporal statistics.

Fabian Mörchen Ingo Mierswa Alfred Ultsch

GPLAG: detection of software plagiarism by program dependence graph analysis.

Chao Liu Chen Chen Jiawei Han Philip S. Yu

Mining for proposal reviewers: lessons learned at the national science foundation.

Seth Hettich Michael J. Pazzani

Pragmatic text mining: minimizing human effort to quantify many issues in call logs.

George Forman Evan Kirshenbaum Jaap Suermondt

Onboard classifiers for science event detection on a remote sensing spacecraft.

Rebecca Castaño Dominic Mazzoni Nghia Tang Ronald Greeley Thomas Doggett Benjamin Cichy Steve A. Chien Ashley Davies

Computer aided detection via asymmetric cascade of sparse hyperplane classifiers.

Jinbo Bi Senthil Periaswamy Kazunori Okada Toshiro Kubota Glenn Fung Marcos Salganicoff R. Bharat Rao

Data mining challenges in the automotive domain.

Michael Cavaretta

Information extraction, data mining and joint inference.

Andrew McCallum

Capital One's statistical problems: our top ten list.

William Kahn

Introducing perpetual analytics.

Jeff Jonas

BLOSOM: a framework for mining arbitrary boolean expressions.

Lizhuang Zhao Mohammed J. Zaki Naren Ramakrishnan

Linear prediction models with graph regularization for web-page categorization.

Tong Zhang Alexandrin Popescul Byron Dom

Identifying bridging rules between conceptual clusters.

Shichao Zhang Feng Chen Xindong Wu Chengqi Zhang

Attack detection in time series for recommender systems.

Sheng Zhang Amit Chakrabarti James Ford Fillia Makedon

Mining progressive confident rules.

Minghua Zhang Wynne Hsu Mong-Li Lee

Coherent closed quasi-clique discovery from large dense graph databases.

Zhiping Zeng Jianyong Wang Lizhu Zhou George Karypis

Integration of semantic-based bipartite graph representation and mutual refinement strategy for biomedical literature clustering.

Illhoi Yoo Xiaohua Hu Il-Yeol Song

Utility-based anonymization using local recoding.

Jian Xu Wei Wang Jian Pei Xiaoyuan Wang Baile Shi Ada Wai-Chee Fu

K-means clustering versus validation measures: a data distribution perspective.

Hui Xiong Junjie Wu Jian Chen

Discovering interesting patterns through user's interactive feedback.

Dong Xin Xuehua Shen Qiaozhu Mei Jiawei Han

Outlier detection by sampling with accuracy guarantees.

Mingxi Wu Chris Jermaine

Incremental approximate matrix factorization for speeding up support vector machines.

Gang Wu Edward Y. Chang Yen-Kuang Chen Christopher J. Hughes

(alpha, k)-anonymity: an enhanced k-anonymity model for privacy preserving data publishing.

Raymond Chi-Wing Wong Jiuyong Li Ada Wai-Chee Fu Ke Wang

Semi-supervised time series classification.

Li Wei Eamonn J. Keogh

A large-scale analysis of query logs for assessing personalization opportunities.

Steve Wedig Omid Madani

Suppressing model overfitting in mining concept-drifting data streams.

Haixun Wang Jian Yin Jian Pei Philip S. Yu Jeffrey Xu Yu

Summarizing itemset patterns using probabilistic models.

Chao Wang Srinivasan Parthasarathy

Efficient kernel feature extraction for massive data sets.

Ivor W. Tsang András Kocsor James T. Kwok

Mining long-term search history to improve search accuracy.

Bin Tan Xuehua Shen ChengXiang Zhai

Combining linguistic and statistical analysis to extract relations from web documents.

Fabian M. Suchanek Georgiana Ifrim Gerhard Weikum

MONIC: modeling and monitoring cluster transitions.

Myra Spiliopoulou Irene Ntoutsi Yannis Theodoridis Rene Schult

Naïve filterbots for robust cold-start recommendations.

Seung-Taek Park David M. Pennock Omid Madani Nathan Good Dennis DeCoste

Automatic mining of fruit fly embryo images.

Jia-Yu Pan André G. R. Balan Eric P. Xing Agma J. M. Traina Christos Faloutsos

Mining for misconfigured machines in grid systems.

Noam Palatin Arie Leizarowitz Assaf Schuster Ran Wolff

Statistical entity-topic models.

David Newman Chaitanya Chemudugunta Padhraic Smyth

Clustering based large margin classification: a scalable approach using SOCP formulation.

J. Saketha Nath Chiranjib Bhattacharyya M. Narasimha Murty

Algorithms for time series knowledge mining.

Fabian Mörchen

Efficient multidimensional data representations based on multiple correspondence analysis.

Riadh Ben Messaoud Omar Boussaid Sabine Loudcher Rabaséda

A new multi-view regression approach with an application to customer wallet estimation.

Srujana Merugu Saharon Rosset Claudia Perlich

A mixture model for contextual text mining.

Qiaozhu Mei ChengXiang Zhai

Visual data mining using principled projection algorithms and information visualization techniques.

Dharmesh M. Maniyar Ian T. Nabney

Clustering pair-wise dissimilarity data into partially ordered sets.

Jinze Liu Qi Zhang Wei Wang Leonard McMillan Jan F. Prins

Sampling from large graphs.

Jure Leskovec Christos Faloutsos

Bias and controversy: beyond the statistical deviation.

Hady Wirawan Lauw Ee-Peng Lim Ke Wang

Cryptographically private support vector machines.

Sven Laur Helger Lipmaa Taneli Mielikäinen

Structure and evolution of online social networks.

Ravi Kumar Jasmine Novak Andrew Tomkins

Algorithms for storytelling.

Deept Kumar Naren Ramakrishnan Richard F. Helm Malcolm Potts

Reducing the human overhead in text categorization.

Arnd Christian König Eric Brill

CFI-Stream: mining closed frequent itemsets in data streams.

Nan Jiang Le Gruenwald

Polynomial association rules with applications to logistic regression.

Szymon Jaroszewicz

Dynamic, real-time forecasting of online auctions via functional models.

Wolfgang Jank Galit Shmueli Shanshan Wang

Recommendation method for extending subscription periods.

Tomoharu Iwata Kazumi Saito Takeshi Yamada

Mining relational data through correlation-based multiple view validation.

Hongyu Guo Herna L. Viktor

Algorithms for discovering bucket orders from data.

Aristides Gionis Heikki Mannila Kai Puolamäki Antti Ukkonen

Evolutionary clustering.

Deepayan Chakrabarti Ravi Kumar Andrew Tomkins

Single-pass online learning: performance, voting schemes and online feature selection.

Vitor R. Carvalho William W. Cohen

Classification features for attack detection in collaborative recommender systems.

Robin D. Burke Bamshad Mobasher Chad Williams Runa Bhaumik

Model compression.

Cristian Bucila Rich Caruana Alexandru Niculescu-Mizil

Query-time entity resolution.

Indrajit Bhattacharya Lise Getoor Louis Licamele

A framework for analysis of dynamic social networks.

Tanya Y. Berger-Wolf Jared Saia

CCCS: a top-down associative classifier for imbalanced class distribution.

Bavani Arunasalam Sanjay Chawla

On privacy preservation against adversarial data mining.

Charu C. Aggarwal Jian Pei Bo Zhang

Outlier detection by active learning.

Naoki Abe Bianca Zadrozny John Langford

Simultaneous record detection and attribute labeling in web data extraction.

Jun Zhu Zaiqing Nie Ji-Rong Wen Bo Zhang Wei-Ying Ma

Event detection from evolution of click-through data.

Qiankun Zhao Tie-Yan Liu Sourav S. Bhowmick Wei-Ying Ma

Extracting key-substring-group features for text classification.

Dell Zhang Wee Sun Lee

Supervised probabilistic principal component analysis.

Shipeng Yu Kai Yu Volker Tresp Hans-Peter Kriegel Mingrui Wu

Regularized discriminant analysis for high dimensional, low sample size data.

Jieping Ye Tie Wang

Extracting redundancy-aware top-k patterns.

Dong Xin Hong Cheng Xifeng Yan Jiawei Han

Discovering significant rules.

Geoffrey I. Webb

Topics over time: a non-Markov continuous-time model of topical trends.

Xuerui Wang Andrew McCallum

Anonymizing sequential releases.

Ke Wang Benjamin C. M. Fung

Center-piece subgraphs: problem definition and fast solutions.

Hanghang Tong Christos Faloutsos

Mining distance-based outliers from large databases in any metric space.

Yufei Tao Xiaokui Xiao Shuigeng Zhou

Acclimatizing taxonomic semantics for hierarchical content classification from semantics to data-driven taxonomy.

Lei Tang Jianping Zhang Huan Liu

Beyond streams and graphs: dynamic tensor analysis.

Jimeng Sun Dacheng Tao Christos Faloutsos

Learning sparse metrics via linear programming.

Rómer Rosales Glenn Fung

Using structure indices for efficient approximation of network properties.

Matthew J. Rattigan Marc E. Maier David D. Jensen

Aggregating time partitions.

Taneli Mielikäinen Evimaria Terzi Panayiotis Tsaparas

Generating semantic annotations for frequent patterns with context analysis.

Qiaozhu Mei Dong Xin Hong Cheng Jiawei Han ChengXiang Zhai

Tensor-CUR decompositions for tensor-based data.

Michael W. Mahoney Mauro Maggioni Petros Drineas

Unsupervised learning on k-partite graphs.

Bo Long Xiaoyun Wu Zhongfei (Mark) Zhang Philip S. Yu

Fast mining of high dimensional expressive contrast patterns using zero-suppressed binary decision diagrams.

Elsa Loekito James Bailey

Rule interestingness analysis using OLAP operations.

Bing Liu Kaidi Zhao Jeffrey Benkler Weimin Xiao

Very sparse random projections.

Ping Li Trevor Hastie Kenneth Ward Church

Workload-aware anonymization.

Kristen LeFevre David J. DeWitt Raghu Ramakrishnan

New EM derived from Kullback-Leibler divergence.

Longin Jan Latecki Marc Sobel Rolf Lakämper

Hierarchical topic segmentation of websites.

Ravi Kumar Kunal Punera Andrew Tomkins

Measuring and extracting proximity in networks.

Yehuda Koren Stephen C. North Chris Volinsky

Maximally informative k-itemsets and their efficient discovery.

Arno J. Knobbe Eric K. Y. Ho

Mining quantitative correlated patterns using an information-theoretic approach.

Yiping Ke James Cheng Wilfred Ng

Training linear SVMs in linear time.

Thorsten Joachims

Adaptive event detection with time-varying poisson processes.

Alexander T. Ihler Jon Hutchins Padhraic Smyth

Frequent subgraph mining in outerplanar graphs.

Tamás Horváth Jan Ramon Stefan Wrobel

Learning the unified kernel machines for classification.

Steven C. H. Hoi Michael R. Lyu Edward Y. Chang

A new efficient probabilistic model for mining labeled ordered trees.

Kosuke Hashimoto Kiyoko F. Aoki-Kinoshita Nobuhisa Ueda Minoru Kanehisa Hiroshi Mamitsuka

Assessing data mining results via swap randomization.

Aristides Gionis Heikki Mannila Taneli Mielikäinen Panayiotis Tsaparas

Quantifying trends accurately despite classifier error and class imbalance.

George Forman

Reverse testing: an efficient framework to select amongst classifiers under sample selection bias.

Wei Fan Ian Davidson

A general framework for accurate and fast regression by data summarization in random decision trees.

Wei Fan Joe McCloskey Philip S. Yu

Orthogonal nonnegative matrix t-factorizations for clustering.

Chris H. Q. Ding Tao Li Wei Peng Haesun Park

Estimating the global pagerank of web communities.

Jason V. Davis Inderjit S. Dhillon

NeMoFinder: dissecting genome-wide protein-protein interactions with meso-scale network motifs.

Jin Chen Wynne Hsu Mong-Li Lee See-Kiong Ng

Mining rank-correlated sets of numerical attributes.

Toon Calders Bart Goethals Szymon Jaroszewicz

Out-of-core frequent pattern mining on a commodity PC.

Gregory Buehrer Srinivasan Parthasarathy Amol Ghoting

Efficient anonymity-preserving data collection.

Justin Brickell Vitaly Shmatikov

Robust information-theoretic clustering.

Christian Böhm Christos Faloutsos Jia-Yu Pan Claudia Plant

Detecting outliers using transduction and statistical testing.

Daniel Barbará Carlotta Domeniconi James P. Rogers

Group formation in large social networks: membership, growth, and evolution.

Lars Backstrom Daniel P. Huttenlocher Jon M. Kleinberg Xiangyang Lan

Global distance-based segmentation of trajectories.

Aris Anagnostopoulos Michail Vlachos Marios Hadjieleftheriou Eamonn J. Keogh Philip S. Yu

Spatial scan statistics: approximations and performance study.

Deepak Agarwal Andrew McGregor Jeff M. Phillips Suresh Venkatasubramanian Zhengyuan Zhu

Learning to rank networked entities.

Alekh Agarwal Soumen Chakrabarti Sunny Aggarwal

Deriving quantitative models for correlation clusters.

Elke Achtert Christian Böhm Hans-Peter Kriegel Peer Kröger Arthur Zimek

Next frontier.

Rakesh Agrawal

New cached-sufficient statistics algorithms for quickly answering statistical questions.

Andrew W. Moore

Self-Organizing wireless sensor networks in action.

John A. Stankovic